火山引擎谭待：大模型的超低定价，来自对技术的信心|高压监狱1到4

央广网

第1 高压监狱1到4百度网盘140 元一根演唱会荧光棒成本仅 10 元，你对五月天演唱会的「天价」荧光棒有何看法？

第2 高压监狱1到4评价辰亦儒曾之乔好好嗑

第3 高压监狱1到4名称传统火影快板《新·醉打君麻吕》非遗作品多多支持

第4 高压监狱1到4百度云国少队亚青赛小组垫底出局，起跑线比拼中国队没有优势

第5 狱女集中营普京称对抗军队的人都是叛徒

第6 满天星《高压监狱》四川高考分数线公布

第7 变态监狱高考分数线

第8 高压监狱高压法版免费端午假期最后天

第9 灭火宝贝3美版傅韵哲高考成绩

第10 高压监狱1到1端午节成都惊现不明飞行物

　　“降价的基本逻辑是，我们有信心用技术手段降低成本，市场也需要更低价的大模型。”

　　5月15日，字节跳动豆包大模型在火山引擎原动力大会上正式发布。火山引擎总裁谭待在接受媒体采访时，谈到了大模型的定价策略。

　　豆包大模型的超低价格引发行业震动。据悉，豆包主力模型的推理输入价格只有0.0008元/千Tokens，比行业便宜99.3%。对此，谭待坦言，“降价是用技术优化成本来实现的。如果只是补贴，用亏损换收入是不可持续的，火山引擎不会走这条路。”

　　据介绍，大模型推理成本的优化，技术上有很多手段。首先是模型本身，模型结构、训练方法都可以持续改进，包括业界很关注的MoE(混合专家模型)，就是优化推理成本很好的解决方案。

　　其次是工程上的优化。大模型的调用量越大，优化推理成本的空间也越大。以前的模型都是单机推理，大模型用的是分布式推理。所以如果能把各种各样的底层算力用得更好，推理成本就会大大降低。

　　谭待进一步解释说，豆包大模型平均每天处理1200亿Tokens文本、生成3000万张图片，这里有不同的负载，可以把不同任务混合在一起，互相错峰，通过智能调度把它们的利用率都跑得很高，就能极大地提升资源利用率，实现整体成本的优化。

　　另外以字节内部业务为例，飞书的主要流量高峰在工作时间，抖音在下班后休闲时间的流量更高，这些不同业务的大模型推理，也能根据业务特点错峰使用，就可以降低成本。

　　对于“大模型开始价格战”的说法，谭待认为，大模型市场仍在发展初期，远远没到激烈竞争的阶段。“池塘有多大，鱼就有多大，现在整个池塘还在培养的过程。”

　　“一个人现在创业，如果要花1万块钱调用大模型，可能会觉得有点贵。我们把价格降到1%都不到，100块钱就能用起来，他的想法也就更容易尝试。”谭待表示，企业的AI转型充满不确定性，试错成本要尽量低，才能更快更多地实现大模型的应用落地，从而让整个行业受益。

　　“之所以选择‘慢就业’，一方面是想做的工作不要我，要我的工作不想去；另一方面，周围的朋友也都在考编、考公，感觉自己不考好像做错了人生选择一样。”小单对记者说。　　在布林肯访华前，我们看到，从马斯克到比尔·盖茨，不少美国工商业有头有脸的人物纷纷前来北京。这显示的当然是美国社会有这么一股劲头，希望以经济发展为重，希望不与中国脱钩断链，希望中美携手有更好的明天。

林生斌关联服饰公司被吊销| 巴黎为姆巴佩标价3亿欧| 派克特喊话节目组| 瓦格纳撤离现场曝光