九九财经 / 生活新闻 / 正文

雷军千万年薪挖角95后AI天才少女热点新闻解读!具体情况怎么样?附网友相关看法

2024-12-30 06:09 阅读了

雷军千万年薪挖角95后AI天才少女

据九九财经于2024年12月30日 06时05分02秒发现,雷军千万年薪挖角95后AI天才少女热点,来源:证券时报

国产大模型DeepSeek在全球火了,并带火了一个95后AI“天才少女”罗福莉。

最近,中国头部量化私募公司幻方量化旗下专注于AI大模型研究开发的Deepseek(深度求索公司),宣布旗下的全新系列模型DeepSeek-V3首个版本上线并同步开源。DeepSeek-V3是深度求索自研的MoE模型(混合专家大模型),不仅以卓越的性能超越或媲美全球顶级的开源及闭源模型,更重要的是训练成本极低,被称为“AI界的拼多多”,以史无前例的性价比被国内外一众圈内大佬点赞,引发广泛关注。

与DeepSeek一起进入大家视野的,是95后AI“天才少女”罗福莉。她曾在DeepSeek参与了DeepSeek-V2的研发,是这款模型的关键开发者之一。在DeepSeek-V3发布前几天,媒体报道称小米创始人雷军已开出千万年薪,将罗福莉招至麾下,罗福莉将就职于小米AI实验室,领导大模型团队。

“AI界拼多多”刷屏海外

据最新发布的技术报告,DeepSeek-V3参数量为671B,激活参数为37B,使用的预训练token量为14.8万亿。其多项评测成绩超越了阿里的Qwen2.5-72B和MetadeLlama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

“中国AI公司Deepseek发布并开源了一个前沿的大语言模型,而其训练的预算却非常低。”前OpenAI联创、知名AI科学家AndrejKarpathy在其个人社交平台上表示,DeepSeek-V3整个训练过程仅用了不到280万GPU小时,相比之下,Meta旗下顶尖的开源模型Llama-3405B的训练时长是3080万GPU小时。如果DeepSeekV3的优良表现能够得到广泛验证,那么这将是资源有限情况下对研究和工程的一次出色展示。

若从成本上进行更直观的对比,假设H800的租金为每GPU小时2美元,DeepSeek-V3的总训练成本仅为600万美元不到,是Llama-3405B超6000万美元训练成本的十分之一不到。

极高的性价比让DeepSeek-V3一经发布便引发国内外广泛关注。Meta的AI研究科学家田渊栋称“在非常有限的预算下实现强劲表现”,“这是一项了不起的工作”。知名AI数据公司ScaleAI创始人兼CEOAlexandrWang也表示,DeepSeek-V3“训练所需计算量减少了10倍”,“在美国休息的时候,他们努力工作,以更低的成本、更快的速度和更强的实力迎头赶上。”

这一圈粉无数的大模型,由被称为“AI界拼多多”的DeepSeek研发。公开资料显示,DeepSeek专注于开发先进的大语言模型和相关技术,由国内知名量化资管巨头幻方量化于2023年创立,也被美国硅谷誉为“来自东方的神秘力量”。

事实上,DeepSeek并非第一次“出圈”。早在半年前,其发布的DeepSeek-V2就因性能达GPT-4级别,但开源、可免费商用、且API价格仅为GPT-4-Turbo的百分之一而引发业内关注。对于为何能做到如此高的性价比,DeepSeek官方解释称,DeepSeek-V2采用了创新的架构,例如注意力机制方面的MLA(多头潜在注意力)和前馈网络方面的DeepSeekMoE架构等,以实现具有更高经济性的训练效果和更高效的推理。

正因为在训练效率和成本方面的优势,DeepSeek也是国内最早开启大模型降价的厂商,也是大模型价格战的源头和推动者。在其发布DeepSeek-V2之后,字节、阿里、百度等厂商纷纷跟进降价。同时,DeepSeek也是中国互联网大厂以外,唯一一家储备了万张A100芯片的公司,这为其早期的技术研发提供了坚实的算力基础。

“我们不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼。”在回应当初为何打响大模型价格战第一枪时,DeepSeek创始人梁文锋表示。这位毕业于浙江大学电子工程系的80后,一直潜心研究技术。据媒体报道,梁文锋在工作中始终保持着低调的作风,和所有研究员一样,每天“看论文,写代码,参与小组讨论”。

一名人工智能行业资深业内人士向证券时报记者分析称,DeepSeek以200人左右的小团队,且不依靠外部融资,做出了一个有性价比并被全球主流AI界人士所认可的大模型。“一是他们在早期就买了很多算力卡,投入了很多资源做研究;二是他们是做量化的,不像大厂有其他各种各样的盈利需求,也跟他们不构成竞争关系,能更专注于模型开发。”该业内人士表示。

背后的AI“天才少女”引发关注

在DeepSeek-V3爆火之后,背后的AI“天才少女”罗福莉也进入了人们的视野。据媒体报道,小米创始人雷军以千万年薪招揽DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉,领导小米AI大模型团队。

公开资料显示,罗福莉本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学专业。2019年,还在北大读硕士的她在人工智能领域顶级国际会议ACL上发表8篇论文(其中2篇一作),登上了知乎热搜。罗福莉用本人知乎账号回应称,“这次投稿ACL是我近一年的产出,所以我认为自己是付出了足够的努力的,当然也可能也有运气成分加持。”

硕士毕业后,罗福莉先是进入阿里达摩院做人工智能研究,从事预训练语言模型相关的工作,负责阿里达摩院AliceMind开源项目,主导开发了多语言预训练模型VECO。2022年,罗福莉加入幻方量化从事深度学习相关策略建模和算法研究,后又跳槽到DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek-V2。

今年5月,在DeepSeek-V2发布以后,罗福莉在知乎上撰文,发表了对于DeepSeek-V2的看法。她表示,“单论DeepSeek-V2模型的中文水平,是真实处在国内外闭源模型的第一梯队”,“外加1元/百万输入Tokens的价格,只有GPT4价格的1/100,性价比之王”。

事实上,罗福莉被重金招入小米,是小米全面发力AI大模型的其中一个动作。2023年4月,小米正式组建了AI实验室大模型团队,并表示将不断挖掘AI相关的用户场景,发挥自身技术优势,并以开放的态度与合作伙伴开拓更多机会。今年11月,小米成立了专门的AI平台部,小米的元老级技术大牛张铎为负责人。张铎本硕毕业于清华计算机系,曾被雷军公开称赞是“小米的大神”,送以“铎神”的称号。

兵马未动,粮草先行。除了招募人才以外,最近,媒体报道称小米正着手搭建自己的GPU万卡集群,并在过去几个月里持续提升算力储备,为大模型研发提供更充分的算力供给。雷军在公开演讲时曾表示,小米做大模型的思路和很多公司不太一样,选择主力突破的是轻量化和本地部署。对于小米这样无论在手机还是造车上都讲究“性价比”的公司而言,如何在烧钱的大模型业务中平衡成本,无疑是雷军考虑的核心问题。而这,或许也是拥有DeepSeek-V2研发背景的罗福莉被雷军看中的原因。

责编:岳亚楠

校对:祝甜婷

网友看法

1、网友爱思考的粉龙月季花:英雄出少年[玫瑰]

2、网友LJ:这个ai能给老百姓带来多大的实惠呢?

3、网友南有乔木:小姑娘太牛了!

4、网友小东北:在市场环境下,中国的年轻人还是大有可为的

5、网友苏锦程:即使是万中无一的天才在自己最擅长的领域内也要花费数以年计的时间和心血专注地去探索,才可以孕育出价值巨大的产品,何况是我这样的普通人呢?更应该把所有的注意力集中到一件事情上去死磕,一年不行,那就五年、十年、十五年,相信时间和坚持一定会改变一切,贫穷算什么?它只不过是我漫漫人生路上的一颗小小绊脚石罢了

6、网友GPT掌门人21:转发了

7、网友人生过客对对对:转发了

8、网友分秒必争溪水W:转发了

9、网友tansuozhe金蝴蝶探索者杨永兴:转发了

10、网友随性自由的海浪CZ:转发了

与年薪相关的阅读

胖东来珠宝部门员工年薪不低于20万(11月11日,胖东来超市官方微信公众号发布招聘公告,此次拟招聘人员共计30人,主要是为胖东来唯初珠宝板块进行招聘,对于形象、身高、年龄、学历等有一定要求。...)

京东采销年薪从16薪涨至20薪(【京东采销年薪从16薪涨至20薪 业绩激励上不封顶】财联社5月27日电,京东集团宣布,自2024年7月1日起,通过一年半时间,京东采销年度固定薪酬由16薪提升至20薪,业绩激励上不封顶。...)

年薪曾超2亿 恒大二号人物“失联”(中新网5月14日电(中新财经记者 左宇坤)5月13日,深圳证券交易所公开了一份《纪律处分事先告知书》送达公告,主角是恒大集团原董事夏海钧。...)

30万年薪的银行员工要过紧日子了(算盘一响,黄金万两。在很多人看来,银行赚利息差的商业模式堪称躺赢。银行工作稳定又体面,赚得也不少,一度跻身中国家长们的最爱工作之一。但时过境迁,曾经“利润高到都不好意思公布”的银行,甚至要节衣缩食了。就在近日,招商银行喊出了过“紧日子”的口号,还登上了热搜。...)

伊万科维奇向足协索要150万欧年薪(直播吧2月23日讯 据《东方体育日报》报道,最新消息显示,前阿曼队主帅伊万科维奇最接近接手国足,他目前已经来到中国,应该是来中国足协进行最终的面试和谈判。伊万科维奇向中国足协索要的年薪在150万欧元左右。...)

中国邮政集团领导层年薪均超100万(根据国家和财政部关于企业负责人薪酬信息公开工作的有关规定,中国邮政网近日披露了中国邮政集团负责人2022年度薪酬的情况,董事长刘爱力的年薪最高,达到110万元,较上年度上浮4.67%。...)

扬科维奇年薪超世界杯18队主帅年薪(直播吧01月24日讯 北京青年报披露,国足现任主帅扬科维奇的年薪为120万欧元,这一薪资水平在国家队主帅中是什么水平?2022年卡塔尔世界杯上,参赛的32队中有14位主帅的薪水等于或大于120万欧元,其他18队的主帅新帅不足120万欧元,这18位主帅包括恩里克、达利奇和森保一。...)

国资委揭秘央企一把手年薪(近日,国资委披露了中央企业负责人2022年度薪酬信息,96家央企分别公布了相关负责人年薪收入情况。据《金融时报》记者初步梳理,2022年度央企负责人应付年薪最高的是中国海洋石油集团有限公司党组书记、董事长汪东进,应付年薪达到96.08万元。...)

选秀专家:刘传兴年薪预计是200万(直播吧11月25日讯 今天,欧洲篮球及选秀专家王健在社媒上谈到了刘传兴在B2千叶队薪资这个话题。王健在个人微博上写道:“刚网上看到有传刘传兴以600万人民币年薪加盟B2千叶,我没有专门去打听过确切的数字,但基本判断是不可能的。...)

杭州一实验室招动物饲养员年薪15万(年薪最高15万养小白鼠,学历要求初中及以上……这几天,一则招聘信息在各大网络平台走红。发布这则消息的用人单位,是浙江首批省实验室之一的良渚实验室。...)

雷军千万年薪挖角95后AI天才少女

相关新闻:
最新新闻: