sci论文数据造假会不会被发现?发现后可能产生什么样的后果?
2024/04/10
sci论文发表一直是严谨的事情,其中数据往往要求严谨性,甚至有的期刊会需要作者提交原始数据,一些作者心理存有侥幸心理,也有一些疑问:sci论文数据造假会不会被发现,发现后会产生什么后果?
造假被查出来的大都是生物,材料之类的领域,然而计算机(特指深度学习)才是重灾区,造假容易复现困难,随机性强,别说二流论文,顶会论文都没有参考价值。所以除了廉价劳动力够多的大研究室,其他人论文的数量基本取决于科研的程度。
随便举几个例子,先从比较温和的,没什么造假空间的领域开始。
比如组合优化的性能曲线,所有人都知道是个指数曲线,你搞个新的剪枝条件,水一点咱不求正确解,毕竟大部分应用下并不需要正确解,切掉1%的解换来50%的速度是很合理的思想。什么性能改进不够大?5次实验最好的跟最坏的比啊,还不行用C+SIMD写的跟Java的比啊,再不行说实话你随便编个数也没人看得出来,毕竟理论上行得通,行不通那是他程序写的不好。
要说上面想法毕竟真的,顶多偷懒不想做实验,到了ML领域之后那就是明明白白的造假了。数据集精选到位,想法再烂几百个实验里只要能挑出一个能看的,那就是顶会苗子——normalization + adaptive learning rate + manifold constraint审稿人怎么知道哪个项work?实际上去年的AAAI上有2篇就是我几年前尝试过但完全不work的方法,他们在没改主要优化项的同时怎么把这个东西弄work的我也不知道。
再进一步,古典ML还要你写程序做实验,到了DL里这些全都可以省了,完全可以画图编数据发顶会一步到位。毕竟就是个人肉Architecture Search,随便找个domain画个图,编个比SOTA高一点的精度,一篇论文就诞生了。需要公开数据集和代码?某国际大厂研究院实习生发的顶会论文也带代码,连矩阵的dim都写反了,核心代码10行里写错了5行,那精度也是让人堪忧的。
最近有些研究都开始明目张胆的把validation dataset的distribution当制约条件,甚至直接sample数据进train loop,人家都把造假上升为novel approach了,就别提被发现了。你只是想发个水刊,基本上不会有人狙你,大家都很忙的,谁有精力来管你这些东西。但是不排除你可能会被有竞争关系的人盯上,一般这种就没办法,自认倒霉吧。毕竟要想人不知,除非已莫为。
学术研究这么多年,低垂的果实早就被前人摘掉了,剩下的就需要靠精力和经费去堆,如果没有那个学术信仰,还是不要在这里面挣扎了。不然很多年后想起来,即使发过不少文章,但总是问心有愧的。
所以你还在考虑通过学术造假来达到某种目的话,一般也没人站在所谓的道德高地去指责你因为很多事情可能就是不得已而为之,包括我。但如果真的以后要搞学术,还是要珍惜自己的羽毛,毕竟学术这一块向来容不下污点。
文章来源网友分享,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2025最新JCR分区及影响因子1939
-
好学术:科研网址导航|学术头条分468
-
《时代技术》投稿全攻略:一位审稿499
-
2025年国际期刊预警名单发布!600
-
2025年中科院期刊分区表重磅发3957
-
中科院已正式发布2024年预警期861
-
2025年度国家自然科学基金项目727
-
中国科协《重要学术会议目录(202733
-
2024年国家自然科学基金项目评1138
-
2024年JCR影响因子正式发布1214
-
吉林大学校长张希:学术会议中的提1391
-
SCI论文插图全攻略:从规范解析08-01
-
国际学术会议参加经验是怎么样的呢08-01
-
掠夺性会议是怎么进行判断的呢?—08-01
-
SCI论文投稿费怎么交?202408-01
-
科璨展览(上海)有限公司 24136
-
山西师范大学 23923
-
中国农业科学院农业信息研究所 21101
-
BITCONFERENCES 24052
-
2018第二届教育与社会发展国际 23029
-
大连理工大学 22924
-
德国TEMA技术市场开发股份公司 21322
-
山西太原师范学院 17975
-
北京铭创展览展示有限公司 23980
-
IETP-Association 24050
-
东南大学数学系 18079
-
上海永銮贵金属经营有限公司 20932
-
湖北研学博科文化传播有限公司 8031
-
中国能源学会 24195
-
中国民族卫生协会医院医师分会 23254
-
新疆中国旅行社有限公司 18004
-
中国环境科学学会 1874
-
湖南微点互动网络科技有限公司 8493
-
南宁左江会展商务服务有限公司 17911
-
海南红帆会展服务有限公司 1878