首页新闻文化生活科技金融教育房产体育健康旅游汽车美食摄影图片

当前位置：江南文明网 > 科技 >

用暂停token重新训练大模型

用暂停token重新训练大模型

让ChatGPT给出答案之前多想想步骤，就能提高准确率。

那么能不能省去提示词，直接把这种能力内化在大模型里呢？

CMU与谷歌团队的新研究，在训练大模型时加入暂停token来实现这一点。

实验中，8项评测成绩提升，其中SQuAD的EM得分提高18%，CommonSenseQA提高8%，GSM8k中的推理任务也提高1%。

研究者Jack Hack表示，自己不久前就提出类似假设，很高兴看到它被验证。

英伟达工程师Aaron Erickson表示，是不是和人类说话时加入“嗯嗯啊啊”是一个道理？

预训练微调都加入暂停token

整个研究基于一个简单的想法：

在输入序列后面追加一系列（暂停token），从而延迟模型输出下一个token。

这可以给模型额外的计算时间来处理更复杂的输入。

作者不仅在下游任务微调时引入，还在预训练时就随机在序列中插入，让模型在两阶段都学习如何利用这种计算延迟。

图片新闻

: 国庆长途出行开纯电车的都是勇士？

: 曾经对标汉兰达

: 丰田全新SUV曝光！

: 英菲尼迪Q50L 6.5折甩卖17.2万起！

热门

云南均取胜，冲甲悬念延续至末轮

国足苏醒，复仇亚洲劲旅

青岛和成都各踢一场，球迷要防止被骗

梅球王来华成热点，名宿用数据为C罗发

重庆铜梁龙提前一轮问鼎本赛季中乙冠

她从亚运会赛场回来，成了校园明星

世界杯亚洲名额增加，不代表更容易

梅西11月开启第8次中国行，将分别在青

今天，芜湖这场比赛星光闪耀

鲁能足校到恒大足校参观交流

推荐

外媒：Zoom为付费用户提供新功能以保护

小米智能猫眼1S发布，5英寸IPS屏+1080P摄

ChatGPT安卓版正式上线

最新罗永浩直播用“第一” 专家：擦边

realme X50 Pro屏幕素质有多好？

美国芯片巨头高通宣布新款5nm芯片登场

2023展望：手机圈即将出现的五大新技术

中国使用移动支付非常普遍，那现金到

4000左右预算，OPPO Reno9 Pro+还是vivo X90？

苹果更新了 Apple Music for Artists 应用