感谢it之家网友 葱花我爱吃、巧遇.、stephen_233、sean_冬瓜、秦淮一梦、ttbtb、滑溜的肥皂、ll j、乌蝇哥的左手、neko_233、大眼夹、流汗黄豆 的线索投递!
,open-ai 刚刚公布了其大型语言模型的最新版本 ——gpt-4。
gpt-4 可以更准确地解决你的难题,多模态的 gpt-4 还可以生成、编辑具有创意性或技术性的文章,在高级推理方面的表现超过其前辈。当然,正如大家所猜测的那样,微软 newbing 的聊天功能确实基于gpt-4。
此外,该公司正在与九游会国际的合作伙伴 be my eyes 一起测试 gpt-4 的图像输入能力。
除了介绍网站,openai 还提供了描述 gpt-4 功能的技术性论文,以及详细描述其局限性的系统模型 card。
openai 计划通过 chatgpt 及其商业 api 为用户提供 gpt-4 的文本功能支持,但目前还需要等待。it之家这里需要提醒一下,gpt4 目前仅 chatgpt plus 账号可用,可选 gpt4 模式进行对话,每 4 小时限制发送 100 条消息。
收费方面,大约 750 个单词的提示收取约 3 美分的费用,约 750 个单词的响应则收取 6 美分。
据介绍,gpt-4 比以前的版本“更大”,这意味着它已经借助比前辈更多的数据进行了训练,并且在模型文件中有更多的权重,从而使得它的运行成本更高。
就任务而言,gpt-4 的表现比前辈更好,它可以遵循自然语言的复杂指令并生成技术或创意内容,而且它可以还更深入地做到这一点:它支持生成和处理多达 32768 个标记,从而实现比前辈更长的内容创建或文本分析。
openai 表示,gpt-4错误答案更少,而且也会减少偏离话题的可能,也尽可能不会再谈论禁忌话题,甚至在许多标准化测试中比人类表现得都要更好一些。
例如,gpt-4 在模拟律师考试的成绩在考生中排名前 10% 左右,在 sat 阅读考试中排名前 7% 左右,在 sat 数学考试中排名前 11% 左右。相比之下,gpt-3.5 在律师考试中的得分一般都是倒数 10% 左右。当然,它们考个研究生还是没问题的。
当然,ai 毕竟是 ai,openai 也表示目前 gpt-4 并不完美,它在很多场景下的能力都不如人类。
据称,该模型仍然存在“幻觉”或编造事实的问题,并且在事实方面也不一定总是可靠的,“它倾向于坚持认为它是正确的,即使它错了”。openai 表示,gpt-4 正在努力解决其局限性,例如社会偏见、幻觉和对抗性提示。
热门文章