大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,专注于分享AI全维度知识,包括但不限于AI科普,AI工具测评,AI效率提升,AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。
小伙伴们还记得几个月前,Anthropic为Claude推出的Artifacts功能吗?
Claude Artifacts随着Claude 3.5 Sonnet
模型一同被发布,这个新功能扩展了用户与Claude互动的方式。当用户让Claude AI生成如代码、文档或网站设计等内容时,这些Artifacts(生成物)会在对话窗口旁的专用窗口中显示。这样创建了一个动态的工作空间,便于用户实时查看、编辑和构建Claude的创作内容。
Claude Artifacts一经发布,受到了很多用户的喜爱,可以说这一功能为Claude狠狠圈了一波粉。Claude Artifacts功能强大,比如下面这些UML图和产品原型图都可以由Claude生成并直接展示出来。
今天,OpenAI官宣了类似的功能——Canvas。OpenAI给Canvas这个功能的定位是“A new way of working with ChatGPT to write and code”,即让用户能更高效地与ChatGPT协作完成写作和编程项目。Canvas由GPT-4o
模型驱动,目前处于测试阶段。Canvas是一个全新的工作界面,会在一个独立窗口中打开,用户和ChatGPT可以在同一个项目中进行协作,不再局限于单纯的对话。
从今天起,所有ChatGPT Plus和Team用户将能够体验Canvas,企业和教育用户将于下周获得访问权限。并且,OpenAI表示Canvas将在正式版发布后向所有ChatGPT免费用户开放。
省流版摘要
-
Canvas正式发布:OpenAI推出全新Canvas界面,支持在ChatGPT中进行写作和编程协作。该功能目前向ChatGPT Plus和Team用户开放测试,企业和教育用户将于下周上线。
-
提升写作协作体验:Canvas提供了新的工作模式,允许用户高亮文本、直接编辑,并通过快捷键让ChatGPT进行长度调整、风格修改等操作,大幅提升复杂项目中的编辑和优化效率。
-
编程功能增强:Canvas支持代码审查、调试、错误修复以及多语言移植(支持
JavaScript
、Python
、Java
等),让编程工作中的多次迭代更加直观和高效。 -
GPT-4o专为协作优化:Canvas使用经过专门训练的
GPT-4o
模型,可以更好地理解上下文并提供精准反馈,支持在需要时触发针对性的编辑或重写功能,显著提高整体协作效率。 -
开放测试中的持续改进:Canvas当前为测试版本,未来将继续改进,增加更多功能,以优化AI协作体验。
与ChatGPT全新的协作体验
很多人每天都在使用ChatGPT来进行写作和编程。然而,虽然传统的对话界面简单易用,适合处理各种任务,但在需要反复编辑和修改的项目中,单纯的对话模式往往不够灵活。针对这种需求,Canvas提供了一个全新的工作界面。
通过Canvas,ChatGPT能够更好地理解你所要完成的任务背景。用户可以高亮特定的内容,明确指示ChatGPT需要关注的重点。就像是一个文字编辑或者代码审查员,ChatGPT可以基于整个项目提供行内的反馈和建议。
在Canvas中,用户对项目拥有完全的控制权。你可以直接编辑文本或代码,还能通过快捷菜单要求ChatGPT调整文本长度、调试代码,或者快速执行其他实用操作。此外,你还可以通过Canvas中的返回按钮,轻松恢复工作中的先前版本。
当ChatGPT检测到合适的场景时,Canvas会自动打开。当然,用户也可以在提示中加入“使用Canvas”,手动调用这一功能来处理现有项目。
写作的快捷功能包括:
-
建议编辑:ChatGPT提供行内建议和反馈。
-
调整长度:调整文档长度,使其变长或缩短。
-
改变阅读难度:从幼儿园到研究生,调整文本的阅读级别。
-
最终润色:检查语法、清晰度和一致性。
-
添加表情符号:根据需要添加表情符号,增强表达效果。
在Canvas中进行编程
编程是一个反复迭代的过程,而通过对话模式,很难追踪和理解代码的每次改动。Canvas通过一个更直观的界面简化了这个过程,使得跟踪和理解ChatGPT对代码的修改变得更加直观。同时,OpenAI还计划在Canvas中进一步提高这类修改的透明度,帮助用户更清楚地了解每一次改动。
Canvas中的编程快捷功能包括:
-
代码审查:ChatGPT提供行内建议,帮助改进代码质量。
-
添加日志:插入print语句,辅助调试并理解代码运行逻辑。
-
添加注释:为代码添加注释,使其更易于理解和维护。
-
修复错误:检测并重写有问题的代码,解决潜在错误。
-
语言移植:将代码翻译为JavaScript、TypeScript、Python、Java、C++或PHP等编程语言。
经过特别训练的GPT-4o模型
为了使GPT-4o
能够成为真正的创意协作伙伴,该模型经过了专门训练,可以根据任务需求自动触发Canvas界面,进行有针对性的编辑,甚至是全篇重写。此外,模型还能理解更广泛的上下文,以提供更精确的反馈和建议。
为了实现这一目标,OpenAI研究团队开发了以下核心功能:
-
在写作和编程任务中触发Canvas
-
生成多样化的内容
-
进行有针对性的编辑
-
重写文档
-
提供行内评论
在超过20次的内部自动化评估中,模型通过新颖的合成数据生成技术得到了后期训练,如从OpenAI o1-preview
中提取输出,以便快速提高写作质量和用户交互体验,而无需依赖人工生成的数据。
触发Canvas的时机是一个关键挑战。模型经过训练,在某些任务(如“写一篇关于咖啡豆历史的博客”)中触发Canvas,而避免在常规的问答任务中(如“帮我做一道新菜谱”)频繁触发。对于写作任务,优先提高“正确触发”的准确率,目前相比于基础的GPT-4o
模型,已达到83%的正确触发率。
值得注意的是,触发基线的质量对于特定提示词极为敏感。不同的提示词可能会导致基线模型表现不佳,但其错误分布在写作和编程任务中的形式可能不同。因此,在编程任务中,模型特意被调整为避免过度触发,防止打断经验丰富的用户操作。在写作和编程任务中,Canvas触发的准确率得到了显著提升,分别达到了83%和94%,相比之下,基础版的GPT-4o模型在提示指令下的表现远不及此。
除了触发时机,模型还面临何时执行局部编辑、何时进行全篇重写的挑战。通过训练,模型会在用户明确选择特定文本时优先进行局部编辑,否则倾向于进行全篇重写。针对写作和编程中的具体编辑需求,Canvas在优化局部编辑方面表现与基础版GPT-4o
相比,使用Canvas的GPT-4o
模型整体性能提高了18%。
在生成高质量评论方面,模型的训练要求尤其严格。与前两种情况不同,评论质量难以通过自动化评估,因此团队通过人工评估衡量评论的质量和准确性。结果显示,Canvas集成的模型在准确性上比基础的GPT-4o
高出30%,评论质量提升了16%,这表明通过合成数据进行训练,能够显著提高模型的响应质量和行为表现。
如何使用新功能Canvas
目前新功能Canvas只面向ChatGPT Plus和Team会员开放。如何注册ChatGPT以及如何开通ChatGPT Plus会员,可以看文末的推荐文章。
ChatGPT Plus用户可以在左上角的模型选择页面找到GPT-4o with canvas
,选择这个模型,即可手动进入ChatGPT Canvas页面。
根据OpenAI官方的介绍,在聊天中,如果ChatGPT检测到是和写作、编程相关的任务,ChatGPT也会自动进入Canvas页面。同时,也可以在提示词中加入“使用Canvas”这样的关键词,主动打开Canvas页面。
精选推荐
都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。