一文了解 ChatGPT 等 LLMs 得到明显改进的 3 个变化

欧易OKX

欧易OKX

               

欧易OKx是全球三大比特币交易所之一,注册即开最高6万元盲盒,100%中奖!

           官网注册

原文作者:Tanya Malhotra

来源:Marktechpost

近年来,大型语言模型(Large Language Models,LLMs)在全世界受到了广泛赞赏,并在自然语言处理领域备受欢迎。这使我们能够使用比以往任何时候都更好、更清晰的语言理解来描述智能系统(Intelligent Systems)。

诸如 GPT-3、T5、PaLM 等 LLMs 的性能有了显着提高,并且这些模型将继续存在,因为它们可以完成从通过学习阅读来模仿人类,到生成文本和总结长段落内容的所有工作。而根据一些深入的研究,如果 LLM 的规模很大,那么它的表现就会很好。通过在大量数据上训练这些模型,它们可以理解人类语言的语法、语义和语用学。

由 OpenAI 开发的流行的大型语言模型 ChatGPT 之所以发展得如此之快,正是因为采用了人类反馈强化学习(RLHF)等先进技术。通过 RLHF,机器学习算法结合并使用人工输入提高了模型的性能。它针对预训练的 LLM 进行了微调,用于开发聊天机器人、虚拟助手等任务。

此外,ChatGPT 等 LLMs 所基于的预训练基础模型也得到了明显的改进。这主要是由于三个方面的变化:

1.实践证明,模型的扩展性(Scaling)对提高其性能很有帮助。以 Pathways 语言模型(Pathways Language Model,PaLM)为例,该模型通过扩展小样本学习(few-shot learning)大大影响了其性能,小样本学习可以减少根据具体应用调整模型所需的特定任务训练实例的数量。

通过使用 Pathways 语言模型在 6144 TPU v4 芯片上扩展和训练 5400 亿个参数,PaLM 展示了重复扩展的好处,其表现超过了各种传统模型,并显示出很大的进步。因此,深度和宽度的扩展都是提高基础模型性能的一个重要因素。

2.另一个变化是在预训练时增加标记数量的过程。像 Chinchilla 这样的模型(开源语言模型)已经证明,通过增加预训练数据,大型语言模型的表现会更好。

Chinchilla 是一个计算最优模型。在相同的计算预算下,在 70B 参数和比 Gopher 模型多四倍的数据上进行训练,Chinchilla 的表现一致优于 Gopher,它甚至比 GPT-3、Jurassic-1 和 Megatron-Turing NLG 等 LLMs 效果更好。这清楚地描述了对于每一个计算最优的训练,标记的数量应该相应地缩放——即模型大小的两倍,因此训练标记的数量应该是两倍。

3.第三个变化是使用干净和多样化的预训练数据。Galactica 的性能证明了这一点,它是一种存储、混合和推理科学知识的大型语言模型。经过几篇科学论文文本的训练,Galactica 的表现优于 GPT-3、Chinchilla 等模型。另一个大型语言模型 BioMedLM 是一种针对生物医学文本的特定领域 LLM,在针对特定领域数据进行训练时,它表现出了巨大的性能提升。它清楚地表明,在特定领域的数据上进行的预训练胜过在通用数据上的训练。

结论

LLMs 的成功无疑归功于多种因素的混合,包括 RLHF 的使用和预训练基础模型的发展。这三个变化极大地影响了 LLMs 的性能。此外,GLaM(通用语言模型)通过使用稀疏激活的混合专家架构(Mixture-of-Experts architecture),以更少的训练成本扩展模型的容量,从而显着提高了性能。因此,这些变化为更高级的语言模型开辟了道路,而这些模型将继续让我们的生活变得轻松。

风险提示:根据央行等部门发布“关于进一步防范和处置虚拟货币交易炒作风险的通知”,本网站内容仅用于信息分享,不对任何经营与投资行为进行推广与背书,请读者严格遵守所在地区法律法规,不参与任何非法金融行为。本文收集整理自网络,不代表经典网立场,如若转载,请注明出处:https://www.jingdian230.com/jinse/17747.html

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台用户上传并发布,本平台仅提供信息存储服务。

Special statement: The above contents (including pictures or videos, if any) are uploaded and released by users of the we-media platform. This platform only provides information storage services.

(0)
欧易OKX

欧易OKX

               

欧易OKx是全球三大比特币交易所之一,注册即开最高6万元盲盒,100%中奖!

           官网注册

相关推荐

  • 小微信贷需要受托支付吗?

    小微企业不规律的资金需求节奏,与追求稳定的商业银行资金供给之间,容易形成天然矛盾。目前,业内小微信贷业务实际能够操作的自主支付额度上限仅有50万元。   上周记者跟踪了一…

    金色财经 2023年 9月 1日
    130
  • 教程:如何在Uniswap V3添加ARB单币LP?

    北京时间今晚 9 时, ARB 空投领取即将开始。目前距离空投申领仅剩约 3 个小时。除了参与 ARB 交易,在 DEX 中为 ARB 交易对提供流动性也是一个赚取收益的额外途径。…

    2023年 3月 23日
    215
  • 未来银行贷款利率的趋势会怎样?如何预测?

    未来银行贷款利率的趋势会怎样?如何预测? 预测未来银行贷款利率的趋势需要考虑多个因素,包括宏观经济环境、货币政策、市场竞争、国际市场利率等。以下是一些可能影响未来银行贷款利率趋势的…

    金色财经 2023年 10月 1日
    106
  • 灰度诉SEC案开庭 法官质疑SEC拒绝申请背后逻辑

    3月7日,针对美国证券交易委员会(SEC)拒绝灰度将GBTC转化为现货比特币ETF的申请一事,双方已在哥伦比亚特区上诉法院展开法庭辩论。在本场口头辩论中,法官小组就SEC拒绝灰度申…

    2023年 3月 8日
    174
  • 银行转账一次性可以转多少?转账手续费怎么收取?

    很多人的资金一般都是存在银行的,交易往来有资金需要直接银行转账就可以了。那么,银行转账一次性可以转多少?转账手续费怎么收取?希财君为大家准备了相关内容,以供参考。 银行转账一天最多…

    2023年 6月 14日
    117
  • 中小企业融资难:人大代表吁推出无抵押贷款

    中小微企业融资难、银行对其贷款门槛高、民间借贷规范化不够,这是被一些人大代表、政协委员热议的老话题。2013年政府工作报告中明确指出,必须进一步放宽民间投资市场准入,激发民间投资活…

    金色财经 2024年 1月 7日
    163
  • 广州多家银行收紧个人按揭贷款

    广州各家银行对个人房地产按揭贷款再度收紧,多家商业银行已取消了普通客户首套房贷8.5折贷款利率优惠,下一步不排除更多银行提高贷款利率。   近期包括农业银行、中国银行、光…

    金色财经 2023年 8月 25日
    102
  • 蚂蚁借呗提前还款有什么样的坏处 还能再借款吗

    蚂蚁借呗提前还款不用交手续费,同时也会减少一些利息,蚂蚁借呗也是受用户欢迎的借贷服务。那么蚂蚁借呗提前还款还能再次借款吗?会上征信吗?会有什么样的后果? 蚂蚁借呗提前还款还能再次借…

    2024年 1月 19日
    80
  • 欧易OKX

    欧易OKX

                   

    欧易OKx是全球三大比特币交易所之一,注册即开最高6万元盲盒,100%中奖!

               官网注册
  • 郑州首套房贷利率没动 但审批周期变长

    “十一”长假过后,成都等地首套房贷款利率最高上浮10%。昨日,在郑州市区中农工建四大行及广发、浦发等商业银行发现,郑州市未出现首套房贷款利率上调现象,多数银行执行基准利率。但是,一…

    金色财经 2023年 8月 30日
    151
  • 提前还车贷,遭银行扣大半手续费

    案例:近日,迟女士反映去年年底,自己用民生银行信用卡分期付款的方式购买了一辆价值十几万的车,其中除去首付外,14万贷款分期36个月,分期付款的1.9万左右手续费也于今年1月份一次付…

    金色财经 2023年 8月 27日
    99