最新观点汇报:
1、openai 从闭门会纪要看出,公司致力于gpt4 “降本 加速”,这个月全球开放gpt4 api,应该会有一次加速降本,幅度参考gpt3.5那一次 ,它api降了90%,最近一次针对gpt api 具体数据没有完全确定,只能参考 gpt3.5 蒸馏降本90% 和google palm2 的api成本反推(google palm2的 gpt4 3月公告的6美分 的20%。路径怎么实现?蒸馏!简单说就是大模型教小模型怎么做一个好模型。老师教学生,参数可以减少70%以上,但是精度最大化保留,能保留92%以上。这是一个方法!还有一个办法,优化工程,提升算力利用率。两者结合就可以大幅降低api公司甲方的成本!没有减少芯片量,只是缩小了模型!
2、从闭门会议纪要看,gpu交付速度远低于openai的需求,极度需求!!英伟达8.25号的财报我们预期还会超预期!此外meta近期要开自己的大模型,闭源付费的那种,收费方式和gpt3.5类似。商用大模型越来越多,应用b端和c端也会越来越多,未来对gpu asic推理芯片的需求只会越来越大!最简单的比喻,一起就一家卖雨伞的,卖300一把,接下来三家卖雨伞的,一把40。那民众买雨伞的人是不是越来越多?供应雨伞伞股的公司是不是卖越来越多?
熊莉