“很漂亮的模型。”她说,“它的语义理解能力,比市面上所有公开的模型,都要高出一个量级。”
“但是……”苏-阳的眉头,又皱了起来。
“它的算力消耗,太恐怖了。”
他指着另一块屏幕上的监控数据。
“我们调用了学校超算中心百分之三十的资源,才勉强让它完成了一次完整的训练。”
“一次训练,就要烧掉几十万。这根本无法商业化。”
实验室里的气氛,瞬间从狂喜,跌落到凝重。
一个无法投入实际应用的模型,无论多先进都只是一个昂贵的玩具。
“问题出在哪里?”陆若溪问。
“CPU。”苏阳一针见血。
“我们现有的计算架构,是以CPU为核心的。它擅长逻辑控制,但不擅长这种大规模的,并行的,浮点运算。”
内容未完,下一页继续阅读