上海交大林云:揭秘大模型的可解释性与透明度,AI 编程的未来在这里!

AIGC动态4个月前发布 ai-front
731 0 0
上海交大林云:揭秘大模型的可解释性与透明度,AI 编程的未来在这里!

 

文章摘要


【关 键 词】 大语言模型软件开发代码编辑数字孪生AI赋能

林云教授在AICon上海站的会前采访中深入探讨了大语言模型软件开发中的应用及其带来的变革。他指出,大语言模型通过压缩和编码大量编程知识,有效弥补了专有或领域知识的不足,提高了代码生成、编辑、测试和调试的自动化水平。例如,林教授的课题组与字节跳动合作,提出了基于语言模型的端到端代码编辑方案,有效解决了编辑的传播、定位、生成和反馈循环等问题。

林教授认为,大语言模型的优势在于其巨大的常识量,能够泛化出基于大量常识知识的解决方案。但其局限性在于长上下文的确定性推理,如跨文件的数据流分析等。他提出,将语言模型与传统程序分析工具结合,可以有效解决这一问题。

在可解释性方面,林教授分享了提高模型透明度的策略,如表征空间可视化技术和优化的影响函数。这些技术有助于理解模型训练过程中的动态,分析训练数据质量,提高模型的表达能力。他以ISSTA’24的代码编辑工作为例,介绍了如何实现全项目感知的交互式编辑,通过设计两个transformer模型,迭代式地完成编辑定位和生成。

林教授还探讨了数字孪生技术在验证模型能力中的应用。他提出,通过将静态的代码提交恢复为动态的代码编辑场景,可以有效验证模型的性能。这些可解释性技术有助于提高模型的透明度和可信度,帮助程序员更好地理解模型的决策依据。

展望未来,林教授认为,大语言模型嵌入程序开发活动是大势所趋。代码开发活动同时也是数据标注活动,这将引发面向模型的开发活动的思考和创新。他建议,开发者需要了解AI模型的运行原理,具备验证机制来检验模型结果的可靠性,并理解模型的局限性,以实现更好的人机协作编程方式。

AICon全球人工智能开发与应用大会将于8月18-19日在上海举办,汇聚了来自头部企业及研究机构的60+资深专家,分享AI和大模型的落地场景与最佳实践。大会将深入探讨端侧AI、大模型训练、安全实践等前沿话题,为与会者提供技术视野拓展和实践指导。

林云教授是上海交通大学计算机科学与工程系副教授、系主任助理、博士生导师,主要研究领域为软件工程,侧重代码、网页和AI模型的自动分析技术。他在国际顶级会议和期刊发表论文近50篇,担任多个重要国际会议的程序委员会委员和审稿人。

AI技术正深度重塑各行各业的生产与生活方式,从教育、零售、通信到金融,AI无处不在。大模型技术引领创新,精准提升行业效率,成为社会经济发展的强大驱动力。在AI的赋能下,我们正迈向一个更加智能、便捷、高效的新未来。关注AI前线公众号,获取更多免费案例资料,深入了解AI技术如何赋能千行百业。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 2792字 | 12分钟 ]
【原文作者】 AI前线
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...