第1084章 看起来完美,用起来致命。 京圈公子历练,全汉东疯了
陈默的数据仪錶盘上,那条曲线在第二十天的时候出现了一个陡峭的拐点——高质量数据的比例从23%跳到了41%。
他给苏哲打了个电话,声音里带著一种克制的兴奋:
“书记,现在总量八千九百万组。高质量的三千六百万。按这个速度——再有两周——”
“別算了。”苏哲打断他,“给你一个坏消息。”
陈默的声音停住了。
“openai和西门子的forge项目提前了。威尔逊刚发来的情报——他们原计划三个月后正式发布,现在改成了六周。发布会定在底特律,三大车企全部站台。”
电话那头的键盘声也停了。
“六周。”陈默重复了一遍。
“够吗?”
陈默用了十秒做计算。苏哲在电话这头能听到他急促的呼吸声。
“勉强。但数据量必须在四周內突破一亿组,而且高质量占比不能低於45%。否则模型训练出来的效果会有明显短板——特別是在复杂曲面和多物理场耦合这两个维度上。”
苏哲没回话。他在想另一件事。
六周。forge提前发布。
这不正常。
openai的项目管理一向保守——他们在发布gpt系列產品的时候,从来不提前。总是延期。
为什么这次反而提前了?
苏哲拨了威尔逊。
“forge提前发布的原因查到了吗?”
“正在查。初步判断是西门子那边施压了。”威尔逊的声音带著一点不確定,“我在旧金山的线人说,西门子数字工业的ceo上周亲自飞了一趟旧金山跟openai谈判。原因——他们的大夏区业务数据非常难看。盘古造物上线后的三个月里,西门子nx在大夏的新增订阅量下降了61%。续约率从88%掉到了53%。”
苏哲把这几个数字默默记下了。
“他们急了。”威尔逊下了一个判断,“forge如果不儘快上市,西门子在大夏的存量客户也会流失。所以他们寧愿发一个不那么完善的版本,也要抢时间。”
苏哲把电话掛了。
急了的对手会犯错。但急了的对手也最危险——因为他们没什么好失去的了。
当天晚上,苏哲做了一个决定。
他让林锐通知老周:“法律意见书我签了。明天上午送工信部和国家网信办。”
林锐愣了一下。之前苏哲说时机不对,怎么突然改了主意?
苏哲没解释。他在办公桌上铺开了一张白纸,用笔画了一条时间线。
时间线的左端標註著“现在”,右端標註著“六周后——forge发布”。
在时间线的中间偏左位置,他画了一个標记:“举报西门子数据违规。”
在標记的右侧,他画了一条虚线延伸出去,旁边写著:“调查启动→西门子被要求暂停数据同步→大夏用户数据服务中断→ nx用户被迫迁移→迁移到哪里?”
答案不需要写。盘古造物是唯一的选择。
他在虚线的终点画了第二个標记:“用户涌入→数据涌入→训练加速。”
时间差。
举报的目的不是惩罚西门子。是製造一个窗口期——在forge发布之前,让盘古系统吃掉西门子在大夏的剩余市场份额,同时获得这些用户手里的高质量工业数据。
一箭三雕。
第二天上午十点,老周带著法律意见书和全套证据材料坐上了飞燕京的航班。
证据包括三部分:西门子nx用户协议第17.3款的条文分析、三条数据出境链路的流量监控记录、以及47pb数据跨境传输总量的统计报告。
老周在机场候机厅给苏哲打了最后一个確认电话。
“书记,这个举报一出去,西门子肯定会反应。他们在欧洲的政治资源不少——”
“让他们反应。”苏哲的声音很平,“他们能做的无非两件事:要么游说华盛顿施压,要么在欧洲法院反诉。两条路都需要时间。我们要的就是时间。”
老周掛了电话,登了机。
三天后。
国家网信办发布了一份“关於开展外资工业软体数据安全专项检查的通知”。通知没有点名任何公司,但检查范围精確地覆盖了cad、cae、plm三类工业软体——全球在这三个领域有份额的外资企业,不超过五家。
通知发布当天下午,西门子大夏区总部的法务总监紧急飞往燕京。ptc的大夏区总裁约翰·格林——刚从纽约回来没两天——又订了一张去燕京的机票。达索系统的亚太区副总裁也出现在了首都机场的出港大厅。
三家公司的法务团队在燕京的律所里连夜开会。他们拿到的那份专项检查通知,措辞虽然是例行公事的口吻,但內行人一眼就能看出——这不是常规的年度检查,这是有人递了料。
谁递的,他们猜不到具体是谁。但能在这个时间点、这个精確度上触发国家级检查的人,一只手数得过来。
检查的第一步是要求三家公司提交在大夏境內的用户数据存储和传输的完整报告。期限:七天。
七天。
这个期限本身就是一种信號。如果是友好检查,通常给三十天。七天意味著——別磨蹭。
西门子大夏区的技术团队在七天里加了六个通宵,勉强拼出了一份数据传输报告。报告试图把47pb的数据出境说成是“系统运维所需的正常数据同步”,但法务总监在签字之前犹豫了很久。
他知道这个解释站不住。
47pb的“正常同步”——全世界没有一个运维工程师能面不改色地说出这句话。
消息传到京海的时候,陈默正在超算中心盯著训练进度条。
数据银行的上传量在专项检查通知发布后出现了一次跳跃式增长。原因不复杂——很多正在使用西门子nx的企业,在看到检查通知后开始担心自己的数据安全。“我的设计文件是不是已经被西门子拿走了?”这个疑问在行业论坛和微信群里蔓延的速度比任何gg都快。
恐慌催生行动。大批企业开始把nx里的设计文件导出,迁移到盘古造物系统上。迁移的过程中,数据自然而然地进入了数据银行。
第二十三天。总上传数据量:九千四百万组。高质量占比:44.7%。
陈默发的消息比之前任何一次都长,总共三行:
“一亿组的门槛快了。高质量占比还差零点三个百分点。有一个领域的数据缺口很大——精密模具。国內这个行业的头部企业只有那几家,都还没上传。”
本章未完,点击下一页继续阅读。(1 / 2)