新加坡国立大学姚志刚团队和清华大学丘成桐团队推出高维数据非传统去噪新方法
2024/03/26
在过去几十年里,随着数据收集与处理能力的显著提高,各行各业都在面对由海量高维数据带来的机遇与挑战。然而,在处理这些高维数据时,传统的数据分析方法往往过分依赖于特征间的线性相关性。尽管这些线性方法能够简化数据的表示形式,但它们在捕捉数据中的复杂模式方面却显得力不从心。一个典型的例子是,高维数据往往聚集在低维流形附近,而这些特征无法有效地通过低维线性结构来表达。
针对这一问题,流形学习技术成为一种具有前景的解决方案。然而,现有的流形学习方法,如基于流形结构的嵌入和去噪算法,因缺乏深入的几何理解和坚实的理论基础而受到限制。此外,在处理极大规模数据集时,这些技术常面临着计算效率和精度的双重挑战,特别是在生物信息学、金融分析和社会网络数据等应用领域中。
为了深入研究高维数据中的非线性结构,新加坡国立大学统计与数据科学系的研究团队和清华丘成桐数学中心团队提出了一种新算法。该算法基于数据统计分布和隐含几何结构,旨在从高维环境空间中的离散样本点恢复出光滑的低维流形结构。研究人员将高维空间中的观测样本视为未知流形的隐藏信息与环境噪声的混合体。他们通过利用数据中的几何平滑特征及统计收敛性质,估计样本点到流形的距离,并据此给出未知流形的估计及样本点到其上的投影。这种对流形的估计被证明具有给定维数的光滑流形特性,且其估计误差和收敛速度均优于现有方法。此外,为了应对数据维度和数据量的计算挑战,研究人员将此方法与深层生成对抗网络(GANs)结合(如图1(c) 所示),通过循环生成对抗网络学习高低维空间之间的连续映射,来估计隐藏流形的指对数映射,并利用这些映射实现对隐藏流形的初步估计。团队已将该方法应用于欧式空间中的几何模型、卡拉比-丘流形,以及一系列图像数据(图1 (a, d)),并正在尝试处理分析更高维度的前沿实验数据,例如单细胞RNA序列数据。这项工作预计将极大地改变我们处理高维复杂数据集域的效率,并提供潜在的新的视角。

利用该研究中提出的算法拟合潜在流形的示意图。现实世界中的数据通常可被表示为高维向量, 如(a)中的图像数据。通常情况下,这些向量被认为分布在一个低维的未知流形附近(如b中黑色虚线所示)。利用(c)中展示的神经网络框架可以有效地学习这个潜在流形,并得到类似于(b)中红色曲线的估计值。这一方法有助于在高维环境空间内进行如(d)中所示的非线性插值和去噪,从而显著改善数据处理和分析。
该研究中的部分成果近日以“利用循环生成对抗网络进行流形拟合(Manifold Fitting with CycleGAN)”为题,被《美国国家科学院院刊》(Proceedings of the National Academy of Sciences of the United States of America)期刊接收。该研究的完成单位是新加坡国立大学和清华大学丘成桐数学科学中心。该论文的第一作者为新加坡国立大学教授姚志刚,通讯作者为姚志刚与清华丘成桐数学科学中心教授丘成桐,论文作者贡献相当。论文部分研究结果来自于姚志刚在哈佛数学和应用中心访问期间完成的工作。研究得到了新加坡教育部研究基金的支持。
文章来源清华大学新闻,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2026年6月优质国际学术会议推荐 7
-
2026年第17届机械与航空航天工程 193
-
2026年先进航空航天技术与卫星应用 324
-
2026资源、化学化工与应用材料国际 1808
-
2026年图像处理与数字创意设计国际 1632
-
2026年机械工程,新能源与电气技术 6095
-
2026年材料科学、低碳技术与动力工 1819
-
2026年艺术、文化产业与数字媒体国 04-29
-
2026年智慧教育、教育研究与文化交 04-29
-
2026年数字社会、公共管理与经济学 04-29
-
2026 政务服务、数字治理与智慧城 04-28
-
2026 制冷技术、暖通设备与环境调 04-28
-
2026 轻工材料、绿色制造与循环利 04-28
-
2026 多语言智能、翻译技术与国际 04-28
-
2026 生物育种、生态种植与现代农 04-28
-
中国科协发布2025年《重要学术12
-
2026年新锐分区(原中科院期刊2595
-
2025年两院院士增选有效候选人4402
-
2025最新JCR分区及影响因子12342
-
好学术:科研网址导航|学术头条分5673
-
2025年国际期刊预警名单发布!5837
-
2025年中科院期刊分区表重磅发20812
-
吉林大学校长张希:学术会议中的提6954
-
二维超导迈斯纳效应探测研究获进展04-29
-
研究发现笼目超导体中多重范霍夫奇04-29
-
二氧化碳加氢制高碳烯烃与航煤馏分04-29
-
靶向特定蛋白互作界面抑制乙肝病毒04-29
-
研究揭示内源信使调控膜损伤与细胞04-29
-
科学家绘制大脑星形胶质细胞转录因04-29
-
上海交大Bio-X研究院石毅与合04-29
-
东北大学软件学院 23225

-
ICWSR2015 2217

-
北京信息名址管理中心 23315

-
西安外国语大学 18373

-
湖北武汉大学 18352

-
东莞市会展国际大酒店 18483

-
北京新线国际展览有限公司 2272

-
工程信息研究院 18319

-
SCIence and Engi 2495

-
中国水利技术信息中心 2215

-
北京市华夏中医药发展基金会 2751

-
青岛佰意德电子科技有限公司 18249

-
2017年第二届先进电子科学与技 24282

-
香港科学工程协会 23490

-
温州医学院附属第二医院 23490

-
长白山明华会议咨询接待处 18312

-
生物医学工程与生物技术组委会 23325

-
山东视联风行信息科技发展有限公司 2921

-
WWX 23294

-
中国高科技产业化研究会科技成果转 8376




















707






































