Author: Ji Hyung Jung, Hye Won Chung, Ji Oon Lee
Conference and Year: ICML 2021
Keywords: Signal detection, Spiked Rectangular Model
데이터사이언스 분야에서 가장 중요한 문제 중 하나는 주어진 데이터로부터 신호를 감지, 복원하는 기법 개발이다. 본 논문에서는 신호 플러스 노이즈 유형의 데이터 모델에서 신호를 감지, 복원하는 문제를 연구한다. 이와 같은 모델에서 신호의 강도가 노이즈의 강도보다 상당히 강하면 신호를 안정적으로 감지, 복원 할 수 있지만, 신호 대 노이즈 비율이 특성 임계값 보다 낮을 경우 신호를 정확히 복원 할 수 없다. 본 논문에서는 우선 노이즈가 정규 분포를 따르지 않을 경우, 행렬의 각 엔트리를 사전 변환하는 기법을 통해 행렬의 주성분 분석법으로부터 기존보다 더 작은 신호 대 노이즈 비율에서도 신호를 복원 할 수 있음을 증명한다. 또한 신호를 완벽히 복원할 수 없는 영역에서도 신호 존재 여부를 가장 높은 정확도로 감지할 수 있는 이진 가설 테스트 알고리즘을 설계한다.
Figure1: We compare the reconstruction performance of the proposed PCA (top lines) and the standard PCA (bottom lines) for two FashionMNIST images, with the number of measurements N = [3136, 1568, 784, 588, 392] where the data dimension is M = 784. The left most column displays the original images for comparison.
Figure2: The histograms of the test statistic under null hypothesis H0 and alternative hypothesis H1, respectively, for the Gaussian noise with SNR ω = 0.35 and ω = 0.45. It can be shown that the difference of the means of the test statistic under H0 and H1 is larger for ω = 0.45.