腾讯云也在持续使用数字化工具服务文旅、教育等多个产业和社会需求,助力实体经济提质增效
场景之间的知识共享能够使多场景模型相较于单场景建模达到更好的性能。表1 样本情况此外,AntM2C数据集已经进行了去标识化和加密处理,不包含任何个人可识别信息(PII)。
每个用户的平均交互次数超过50次。总体而言,AntM2C数据集中商品和用户的分布能够反映CTR预测的实际情况。这表明在AntM2C中,不同场景之间存在差异和共性,简单地混合训练数据不能得到最佳结果。它通过利用来自多个场景的CTR数据构建一个统一的模型。数据集的应用:多场景CTR预估、冷启动CTR预估、多模态CTR预估基于AntM2C,开源方选择了常用的AUC作为所有实验的度量指标,通过几个CTR预测任务进行了测试,并得到了一些评估结果,作为AntM2C的使用示例。
展 望希望未来有更多的团队加入CTR相关的研究领域,在合规安全的前提下,参与数据集的开源及共建工作。用户特征由静态特征(用户静态属性和商品标题将在后续阶段公开)和用户序列特征组成。而因为商务难以交付,徐元春和袁晶两人执意在小冰自成一派,独领一个团队做事。
但在主外难分的处境下,诞生于微软中国的小冰又始终笼罩在微软美国的影子下。软硬一体的缺点是难度高、交付重,但优势是卖一单赚一单。最开始,小冰是两个年轻人并肩作战。(有关小冰,篇幅原因仍有大量并未在文中呈现。
于是宋睿华就去了小冰。大家都觉得小冰很好玩、很有产品思路。
2013年12月,小冰团队初步组建,李笛负责产品,景鲲负责技术。小冰每年都开技术发布会,但内部又不追求技术的扎实。因为小冰象征着中国技术的快速崛起,得到了多位微软华人高管的保护。于是时任 Cortana 带头人的黄美玉建议要给 Cortana 取一个中文名,王永东采取了黄美玉的提议,才有了小娜的诞生。
在小冰,相比技术的扎实度,能在宣传侧产生噱头的新闻似乎更受重视。小冰与微软的这层关系,是小冰的保护壳,也是小冰的紧箍咒。但实际上,小冰之父最早有两位,一位是李笛,另一位是当时与李笛搭档的景鲲。栾剑在语音合成领域的造诣很深,在小冰内部颇有口碑,也深受李笛的器重。
小冰每年召开一个发布会,或是受发布会的影响,小冰的风格变得越来越重宣传、轻技术,逐渐形成了一种包装技术大过做实技术的文化氛围。再比如,宋睿华负责的团队研究多模态,基于检索技术将一个文字故事转化为了一系列插图,这项工作在多模态领域十分具有开创性。
李笛不拥抱大模型,有成本的考虑。而陆奇提拔景鲲的一大原因,就是景鲲之前在小冰项目中立下的功劳。
但随着数字人领域的开源技术越来越多,小冰原先选择的技术门槛最低的 2D 数字人也逐渐失去了技术的壁垒,市场进入一片红海。今年上半年小冰的 3D 数字人部门更是已经解散。事实上,还没分拆前,小冰在微软内部一直是一个特别的存在。2020 年 7 月,GPT-3 发布后不久,微软宣布小冰分拆,以独立公司运营,李笛担任 CEO。为此,李笛跟小冰团队说,我们要朝着一个方向一直推,不要老是换方向。为了坚持自己的观点,李笛有时也不惜破坏与投资人的关系。
一位曾就职于微软的华人科学家跟雷峰网分享过一个细节:每年年底,萨提亚都会在微软内部组织一次闭门会,邀请六、七个在那年取得颠覆性技术成果的团队作分享。不仅李笛,曾经关注过小冰、甚至为小冰付出过时间与金钱的技术人员或投资者都曾这样相信过。
这个项目始于 2021 年,由曾敏负责。2014 年第一代小冰研发时,李笛为了产品能力的完美呈现,会让团队将数据清洗地很干净,当发现用户问到超出小冰知识范畴的问题时,就去网上找语料做一个索引库兜底,逐个垂类补足,甚至发挥了产品的设计天赋,让小冰嘴硬,遇到超出知识范畴的问题时反问诸如你自己有手,为什么不去查一下,既避开了小冰的知识短板,又让小冰有了人的个性。
小冰独立前是微软在全球范围内最大的人工智能团队。(本系列第四范式篇当下正在写作当中,欢迎添加作者微信 william_dong 交流信息,分享八卦。
曾与李笛接触的投资人向雷峰网这样评价:小冰已经不再是微软时候的小冰,但李笛还是微软时候的李笛。当时文字生成一块的主流技术还是 RNN,宋睿华觉得很有意思,就跟袁晶合作。2017 年 2 月,由于小冰的成功,李笛升职为微软(亚洲)互联网工程院副院长。而几个首席科学家,又因为汇报关系难以统合实力。
高估值科技公司融资的良性循环往往建立在两个基础上,要么是技术的快速进步,要么是营收的快速增长,但小冰与这两个条件都不匹配。曾敏年轻能干,也很受李笛重视,后来被李笛提拔、升了上去,与周力成为同级。
久而久之,就造成了底下的人总是被他钳制住,技术人才的创造力无法被释放出来。但如果超不过,小冰就会沦为第二梯队的 NLP 公司,现有的估值也保不住。
小冰一度选择了一条区分于 Cortana 的发展路径:基于第三方生态系统,在系统中扮演类似中间件的角色,提升第三方互联网产品(如微博)的活跃度。同是依托微软,同是对话机器人。
欢迎添加作者微信 william_dong,交流第一手信息)但随着小冰的名气越来越大,原先满怀理想主义加入小冰的技术人员开始觉得不对劲。但正当李笛为小冰高兴万分时,与他一同打造小冰的景鲲却向微软递交了辞呈,转身去了百度。与小冰同期的几乎所有对话类产品,如 Cortana、Siri、Google Assistant、Alexa,都选择了软硬一体的道路。原先小冰的对话产品是基于小模型,早期被行业人士评价为像一个个 Demo,难以落地。
微软是小冰最大的股东,小冰的一些订单来自微软的 TTS。嘴硬的李笛李笛为什么反对大模型?无论是先前小冰的拥趸者,还是反对者,大家都对李笛今年在公开场合的多次反大模型言论感到疑惑。
第三轮融资完成时,小冰曾进入一个短暂的快速膨胀阶段,人员规模扩张到约 600 人,但今年年初,小冰就开始为最坏的情况做打算,进行了一波裁员,裁了大约 200 人。(AI 2.0时代,一半是资本追捧的火焰,一半是生存困难的海水。
加入微软前,李笛在游戏行业工作,是任天堂的忠实粉丝。虚拟偶像这块,小冰与遥望科技等企业签署了战略合作,在虚拟人直播带货上也探出了一条新路。
顶: 6踩: 5
评论专区