点击下方卡片关注“CVer”公众号AI/CV重磅干货第一时间送达点击进入—【顶会/顶刊】投稿交流群添加微信号CVer2233小助手拉你进群扫描下方二维码加入CVer学术星球可以获得最新顶会/顶刊上的论文idea和CV从入门到精通资料及应用发论文/搞科研/涨薪强烈推荐克雷西 听雨 发自 凹非寺转载自量子位QbitAIDeepSeek又有核心工程师流入江湖——郭达雅V2、V3、R1等一系列模型的核心作者被曝离职。这位被导师寄予厚望成为“中山大学雷军”的技术天才在学术与竞赛领域有着近乎传奇的履历。他自述在入学博士后的第三天便完成了毕业所需的论文发表要求展现出惊人的科研效率。他还多次在腾讯广告算法大赛中蝉联冠军并在ATEC科技精英赛和微信大数据挑战赛中斩获头筹。被调侃还没毕业就有着百万奖金。而且新时代的工程师甚至还出现过综艺里。在真人秀《燃烧吧天才程序员》中他作为仅有的两名SSS级“巨佬”选手在60小时的极限挑战中展现了顶尖的编码实力……消息传到外网也引发了很多网友的关注有人表示希望这不会给DeepSeek-V4带来影响。毕竟郭达雅从博士毕业后入职DeepSeek开始就参与了Coder、Math等专项模型以及从V2、V3到R1的完整研发链条还都是核心作者。所以郭达雅究竟是哪一种天才少年DeepSeek多款模型核心作者郭达雅于2023年博士毕业后加入DeepSeek专注代码智能和大语言模型推理。促使他加入DeepSeek的原因很简单有一位师姐在DeepSeek工作和他聊起公司追求AGI的愿景这与他的价值观比较吻合。当时我的一位师姐在 DeepSeek工作她找到了我跟我聊了DeepSeek的愿景——追求AGI推动人类社会的加速发展。这跟我的价值观是相合的。同时DeepSeek有比较多的资源投入研发领导层也希望打造一个有创新氛围和自由的公司。我有这样的热情去做这件事我也想追求这样的工作环境。最终我选择加入了DeepSeek。目前郭达雅的个人主页还没有更新仍然显示为DeepSeek研究员。DeepSeek的一系列模型包括V2、V3和R1还有Math、Coder、Prover和V2-Prover郭达雅全都是核心贡献者。按时间顺序梳理第一条是2024年1月的代码大模型DeepSeek-Coder。这个项目推出了从1.3B到33B的一系列开源代码模型在多项基准上做到了当时的开源代码模型SOTA。第二项成果关于数学推理也就是2024年2月的DeepSeek-Math。它以DeepSeek-Coder-Base-v1.5 7B为基础针对数学能力进行了继续训练额外使用了120B数学相关token。更关键的是DeepSeek-Math的论文中提出了GRPO这个新型强化学习方法后来成为了R1推理的关键。紧接着是形式化证明2024年5月DeepSeek发布了DeepSeek-Prover。这个项目面向Lean 4定理证明核心方法是大规模合成formal proof数据并在此基础上微调DeepSeek-Math 7B。结果模型在Lean 4 miniF2F上whole-proof generation准确率达到 46.3%64 samples累计到52%高于GPT-4的23.0%在FIMO基准上证明了148题中的5题而GPT-4得分为0。这项成果说明DeepSeek的模型不只能完成一般数学推理还延伸到了更硬核的形式化推理方向。还有我们更熟悉的V2、V3和R1在这个研发过程中DeepSeek证明了不依赖人工标注的推理轨迹仅通过纯强化学习也能把大模型的推理能力激发出来并自然涌现出自反思、验证、动态策略调整等行为模式。DeepSeek-R1的相关论文后来还登上了Nature封面该论文披露R1的训练成本仅约29.4万美元折合人民币约208万。总之任职期间郭达雅并不只是参与单点项目而是参与了贯穿DeepSeek一整段主线的研发过程。而在这一系列的成功背后有他从中学时期便已经产生的对计算机、对编程的深厚兴趣。“希望他成为中山大学的雷军”郭达雅曾就读于珠海一中从中学时期便展现出对计算机科学的浓厚兴趣。在接受珠海一中的访谈时郭达雅表示自己选择计算机专业是兴趣使然并且这种兴趣正是产生于中学期间。兴趣是我选择计算机专业并取得如今成就的重要因素而这一兴趣的萌芽正源自珠海一中。回想高中时光学校丰富的实践活动和课程不仅拓宽了我的视野也让我在信息课上第一次接触到计算机编程。最初的我对编程一无所知但很快便被其严谨的逻辑性和无限的创造力深深吸引。通过编写简单的代码我不仅感受到算法的精妙还体会到数学在实际应用中的强大作用。这段经历让我对计算机科学产生了浓厚兴趣也让我在高考结束后毫不犹豫地选择了计算机专业。2014年郭达雅被中山大学计算机学院录取随后留在中大继续直博深造。△来源中山大学网站大四时他入选中山大学与微软亚洲研究院联合培养博士生项目师从印鉴教授和周明博士研究方向是自然语言处理。周明则后来在大模型浪潮中创办了澜舟科技。京东探索研究院副院长、阶跃星辰Tech Fellow段楠的博士生导师也是周明两人算是师出同门。而郭达雅在中山大学对他进行的采访中表示自己在刚入学的第三天就完成了中大博士毕业的论文发表要求。读博期间郭达雅的实习是在联培单位MSRA完成的。其间郭达雅完成了CodeBert以及GraphCodeBert的研究分别发表在EMNLP 2020 Findings和ICLR 2021上。CodeBert开发了一个双模态预训练模型首次实现了自然语言NL和编程语言PL的双模态预训练填补了此前没有模型能同时处理NL和PL混合输入的空白。而GraphCodeBert则在此基础上首次将代码的数据流结构纳入预训练让模型对代码的理解更深入。毕业时郭达雅的博士论文《基于预训练的程序理解与生成》获评2023年中山大学优秀博士学位论文。这篇论文主要以程序理解与生成为研究课题并针对该领域现有研究工作在数据与模型方面存在的问题提出了基于代码预训练的方法和模型目的是利用人工智能技术提高软件开发的效率。从会议到博士论文再到DeepSeek期间的工作郭达雅的工作几乎是一直围绕着Coding展开这也增加了曝料中他离职后负责Coding这一说法的可信度。DeepSeek-V3发布后他的导师印鉴教授还特别寄语希望他能成为“中山大学的雷军”。截至目前郭达雅已在NeurIPS、ACL、EMNLP等国际顶级AI会议发表论文十余篇谷歌学术引用量超1300次。此外在数据挖掘竞赛方面郭达雅也长期活跃于一线赛场2021、2022年他连续两年拿下蚂蚁集团主办的ATEC科技精英赛冠军2022年微信大数据挑战赛3200支队伍同台竞技他带队夺冠成功将30万大奖收入囊中。△来源中山大学网站而郭达雅最具代表性的战绩是在腾讯广告算法大赛中连续夺冠。作为DYG战队核心成员他在2019年获得冠军并于2020年实现卫冕利用BERT算法拿下50万元大奖2021年又成功夺冠。也算是腾讯广告算法大赛名人堂选手了。One More Thing有意思的是学术和竞赛全面开花的郭达雅还有不太“科研”的一面——上综艺。在以程序员为主题的综艺真人秀《燃烧吧天才程序员》中郭达雅和另外15名选手一起展开了60小时的代码极限挑战。节目组把选手分成了S、SS、SSS三个级别SSS级的“巨佬”只有2名郭达雅就是其中之一。郭达雅一出场便引人瞩目“巨佬来了”“神一样的存在”。不仅强而且头发还挺茂密。但现在秦失其鹿天下共逐之…谁又能得到郭达雅呢参考链接[1]https://www.reddit.com/r/LocalLLaMA/comments/1rzu7rc/deepseek_core_researcher_daya_guo_rumored_to_have/[2]https://guoday.github.io/[3]https://mp.weixin.qq.com/s/bYztba9PwPHePhwufd4L7Q[4]https://sai.sysu.edu.cn/node/545本文系学术转载如有侵权请联系CVer小助手删文何恺明在MIT授课的课件PPT下载在CVer公众号后台回复何恺明即可下载566页课件PPT大家赶紧学起来CVPR 2026 所有论文和代码下载在CVer公众号后台回复CVPR2026即可下载CVPR 2026 所有论文和代码CV垂直方向和论文投稿交流群成立扫描下方二维码或者添加微信号CVer2233即可添加CVer小助手微信便可申请加入CVer-垂直方向和论文投稿微信交流群。另外其他垂直方向已涵盖目标检测、图像分割、目标跟踪、人脸检测识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿交流、PyTorch、TensorFlow和Transformer、NeRF、3DGS、Mamba等。 一定要备注研究方向地点学校/公司昵称如Mamba、多模态学习或者论文投稿上海上交卡卡根据格式备注可更快被通过且邀请进群▲扫码或加微信号: CVer2233进交流群 CVer计算机视觉知识星球人数破万如果你想要了解最新最快最好的CV/DL/AI论文、实战项目、行业前沿、从入门到精通学习教程等资料一定要扫描下方二维码加入CVer知识星球最强助力你的科研和工作 ▲扫码加入星球学习▲点击上方卡片关注CVer公众号 整理不易请点赞和在看