73年前，香农已经给大模型发展埋下一颗种子

AIGC动态1年前 (2024)发布 almosthuman2014

2,055 0 0

73年前，香农已经给大模型发展埋下一颗种子

文章摘要

【关键词】 AI考古、香农、语言模型、信息论、冗余度

普林斯顿大学教授承现峻提出，1951年克劳德·香农在贝尔实验室提出的预测下一个单词的问题，成为了当前大语言模型（LLM）的基础。

香农在论文中给出了两种估计英语熵的方法，并通过N-gram模型计算英语的熵。随着N的增加，熵接近英语的实际熵值。

香农还通过实验让受试者猜测短语中的字母，发现英语的冗余度约为69%。

香农的研究对现代计算机科学和自然语言处理（NLP）有深远影响。通过学习大量文本数据，现代大语言模型能够预测下一个词或下一段话的可能性，从而更好地理解和生成人类语言。

香农的工作为信息论和计算机科学奠定了基础，影响了后来的Hopfield网络、ConvNets、Boosting/Adaboost、非负矩阵分解、支持向量机（SVM）等重要研究成果。

香农的研究还展示了如何通过统计方法计算英语的冗余度，并提出了压缩算法如Huffman压缩和Lempel-Ziv压缩，以提高存储效率。

尽管现代计算机拥有足够大的内存，但这些压缩算法在存储文本时仍能节省大量空间。

香农的研究不仅在理论上具有重要意义，还在实际应用中展示了其价值。通过理解语言的统计特性，可以开发出更高效的语言模型和压缩算法，为信息处理和传输提供更好的解决方案。

香农的工作展示了信息论在语言处理中的应用，为现代人工智能的发展提供了重要的理论基础。

原文和模型

【原文链接】 阅读原文 [ 2810字 | 12分钟 ]
【原文作者】 机器之心
【摘要模型】 gpt-4o
【摘要评分】 ★★★★★

OpenAI GPT-4

GPT-4是OpenAI公司开发的自然...

# AIGC动态 # 大模型 # AI考古 # 信息论 # 冗余度 # 语言模型 # 香农

© 版权声明

文章版权归作者所有，未经允许请勿转载。

“绘蛙”

相关文章

Dolly：120亿参数的大型语言模型，你的AI智能助手。

admin

1,796

原作者带队，LSTM真杀回来了！

机器之心

2,510

智源发布FlagEval「百模」评测结果，丈量模型生态变局

机器之心

1,228

被Transformer光芒掩盖的论文，Meta科学家回顾十年前创新之作

机器之心

625

从 0 到 1 了解大模型安全，看这篇就够了

admin

10,247

弱智吧：大模型变聪明，有我一份贡献

机器之心

2,236

“极客训练营”

暂无评论

暂无评论...