标签:文本提取
Hugging Face 发布 FinePDFs:基于 PDF 文档构建的 3 万亿 Token 数据集
Hugging Face 正式发布全球最大的纯 PDF 公开语料库 FinePDFs,为开放训练数据集带来新突破。该数据集涵盖 1733 种语言的 4.75 亿份文档,约 3 万亿个 Token...
Text Inversion: 比 Lora 更简单地训练人脸【Stable Diffusion 炼丹教程】
本文详细介绍了如何使用Text Inversion方法训练Stable Diffusion模型,使其能够生成特定的人物图像。文章首先解释了Text Inversion的基本概念和优势,然后逐...