| 제목 | 그룹화되지 않은 | 작성일 | 2026.05.20 |
|---|---|---|---|
| 첨부파일 | 조회수 | 3 | |
그룹화되지 않은 Alexa Fluor 647 데이터의 경우, 세 가지 IC 점수( 그림 5E ) 모두 3개와 5개의 클러스터가 통계적으로 가장 두드러진 지역 최소값임을 나타냅니다. 신뢰 구간 0.9에서 각각 ⟨D2⟩ = 1.81, FO = 0.07 및 ⟨D2⟩ = 1.71, FO = 0.06의 해당 보조 지표를 고려할 때 , 3 개 클러스터 솔루션 이 최적입니다. 그룹화되지 않은 데이터에 대한 결과적인 3개 클러스터 분석( 그림 5G )은 데이터의 고유한 분포로 인해 가장 밀집된 분포가 아닌 신뢰 타원 내 평균값에 해당하는 클러스터 중심을 갖는 예상되는 광범위한 구조를 재현합니다. 그룹화된 데이터의 경우, IC 점수 플롯은 클러스터 수가 증가함에 따라 감소합니다. 전역 최소값을 최적 솔루션으로 선택하는 표준 IC 기반 접근 방식을 사용하면 더 많은 클러스터 수를 선호하는 경향이 있으며, 이는 이 경우 명백히 과적합으로 이어질 것입니다. 본 알고리즘은 ⟨D2⟩ = 2 및 FO = 0.09에 해당하는 두 개의 클러스터를 최적의 솔루션으로 식별했습니다. 반면 세 개, 여섯 개, 여덟 개, 열 개의 클러스터를 포함한 다른 모든 후보 솔루션은 더 낮은 밀착도 값(⟨D2⟩ < 1.94)과 더 작은 외부 영역 비율(FO < 0.08)을 나타내어 과분 할 및 해석 가능성 저하를 시사합니다. 그룹화된 데이터에 두 개의 클러스터를 사용한 결과는 그림 5H 에 나타나 있으며, 이는 과적합을 방지하면서 그림 5G 의 세 개 클러스터 솔루션보다 더 일관성 있고 시각적으로 조화로운 클러스터 중심을 생성합니다 . 극단적인 이상치를 제거하기 위해, 각 클러스터 중심에서 비정상적으로 멀리 떨어진 데이터 포인트를 식별하기 위해 수정된 IQR 이상치 탐지 규칙( 식 12 참조 )을 적용했습니다. 이 절차를 통해 약 3%의 데이터 포인트가 제거되어 약 97%의 데이터가 유지되었으며, 클러스터 할당은 변경되지 않은 상태로 유지하면서 클러스터 기반 통계의 후속 계산이 이상치에 의해 왜곡되지 않도록 했습니다. 그룹화된 데이터의 경우, 클러스터링 결과 각각 0.75 ± 0.17 ns와 1.94 ± 0.35 ns의 수명을 가진 두 가지 상태가 나타났으며, 가중 평균 수명은 1.73 ± 0.55 ns였습니다.
|
|||