一些随笔
目录
- 思考
- 写在多模态征服一切之前(未来数据和模型应该是什么样的?)
- 关于Compression for AGI
- 论文阅读
- 论文阅读,开源的多模态文档数据集,《OBELISC: An Open Web-Scale Filtered Dataset of Interleaved Image-Text Documents》
- 论文阅读,看了超过200篇中国人写的英文论文后总结出了这些常见错误
- 166页超长论文阅读,大多模态模型的黎明:GPT-4V的初步探索,The Dawn of LMMs: Preliminary Explorations with GPT-4V(ision)
- GPT-4V系统卡解读:智能以外,如何对社会有益?
- 论文阅读,大模型的缩放定律,Scaling Laws for Neural Language Models
- 可以生成空间感知的文本块和以markdown格式的多模态文学模型,Kosmos-2.5: A Multimodal Literate Model
- 基于科学文档的PDE识别,《Nougat:Neural Optical Understanding for Academic Documents》
- 工具
- 科研工具
思考
写在多模态征服一切之前(未来数据和模型应该是什么样的?)
关于Compression for AGI
论文阅读
论文阅读,开源的多模态文档数据集,《OBELISC: An Open Web-Scale Filtered Dataset of Interleaved Image-Text Documents》
论文阅读,看了超过200篇中国人写的英文论文后总结出了这些常见错误
166页超长论文阅读,大多模态模型的黎明:GPT-4V的初步探索,The Dawn of LMMs: Preliminary Explorations with GPT-4V(ision)
上集
下集