原创
2025-12-21
微调GPT-OSS的冗长回复
为什么人类会做梦? > 原回复 > 人类做梦是大脑在睡眠中进行的一系列复杂生理与心理过程的结果,科学界尚未达成统一结论,但已有多种理论解释其目的与功能。下面从几个角度进行探讨,希望能帮助你更好地理解为什么人类会做梦。 --- ## 1. 睡眠阶段与梦的产生 ### 1‑1...
全文 >
转载
2025-12-04
[节选]人工智能现状:基于OpenRouter的实证100万亿token研究报告
讨论 这项实证研究提供了关于LLM实际如何使用的数据驱动视角,突出了几个与人工智能部署的传统智慧有微妙的主题:...
全文 >
原创
2025-11-30
AI 原生为什么是通向整个数字世界的通用接口
这两年用“聊天机器人”写代码、做任务的人越来越多,但真正有意思的变化,不在“更快”,而在“执行得更深”。 先看当前几个智能体编程工具。 Cursor 更像一个聪明的编辑器,理解代码、帮你补全、重构;Codex 已经可以直接用命令行,开始接管环境;Google Antigravity...
全文 >
转载
2025-10-03
[NeurIPS] 最佳数据混合的缩放规律
大型基础模型通常在来自多个域的数据上进行训练,数据混合——所用每个域的比例——在模型性能中起着至关重要的作用。选择这种混合物的标准方法依赖于试验和错误,这对于大规模的预训练来说变得不切实际。我们提出了一种系统方法,使用缩放规律确定任何目标域的最佳数据混合。我们的方法准确地预测了用D令牌和特定域...
全文 >
原创
---
[实验] 解锁 4B 模型的推理潜能:Gemma-3的 In-Context Learning 机制分析
实验模型:google/gemma-3-4b-it (bfloat16) 评测集:GSM8K (Test Subset n=200) 1. 引言:当 Scaling Law 遇上“推理时计算”...
全文 >