ALEX.BLOG

原创 2025-12-21

微调GPT-OSS的冗长回复

为什么人类会做梦？ > 原回复 > 人类做梦是大脑在睡眠中进行的一系列复杂生理与心理过程的结果，科学界尚未达成统一结论，但已有多种理论解释其目的与功能。下面从几个角度进行探讨，希望能帮助你更好地理解为什么人类会做梦。 --- ## 1. 睡眠阶段与梦的产生 ### 1‑1...

全文 >

转载 2025-12-04

[节选]人工智能现状：基于OpenRouter的实证100万亿token研究报告

讨论这项实证研究提供了关于LLM实际如何使用的数据驱动视角，突出了几个与人工智能部署的传统智慧有微妙的主题：...

全文 >

原创 2025-11-30

AI 原生为什么是通向整个数字世界的通用接口

这两年用“聊天机器人”写代码、做任务的人越来越多，但真正有意思的变化，不在“更快”，而在“执行得更深”。先看当前几个智能体编程工具。 Cursor 更像一个聪明的编辑器，理解代码、帮你补全、重构；Codex 已经可以直接用命令行，开始接管环境；Google Antigravity...

全文 >

转载 2025-10-03

[NeurIPS] 最佳数据混合的缩放规律

大型基础模型通常在来自多个域的数据上进行训练，数据混合——所用每个域的比例——在模型性能中起着至关重要的作用。选择这种混合物的标准方法依赖于试验和错误，这对于大规模的预训练来说变得不切实际。我们提出了一种系统方法，使用缩放规律确定任何目标域的最佳数据混合。我们的方法准确地预测了用D令牌和特定域...

全文 >

原创 ---

[实验] 解锁 4B 模型的推理潜能：Gemma-3的 In-Context Learning 机制分析

实验模型：google/gemma-3-4b-it (bfloat16) 评测集：GSM8K (Test Subset n=200) 1. 引言：当 Scaling Law 遇上“推理时计算”...

全文 >