2022年5月15日,关于“AI与大模型时代的数据治理新范式”高端研讨会在杭州人工智能小镇成功举办。浙江安易信科技有限公司技术部总经理 何冲作为特邀嘉宾出席会议,并发表《面向大模型训练的数据治理体系构建与实践》主题演讲,与来自学术界、产业界的200余位专家共同探讨人工智能浪潮下的数据治理创新路径。

在演讲中,何冲副总深入分析了当前大模型发展面临的数据治理挑战:“大模型训练需要海量数据支撑,但数据质量参差不齐、版权边界模糊等问题日益凸显。”针对这一现状,他系统介绍了安易信科技研发的"数据治理中台"解决方案。该方案通过构建数据质量评估、版权溯源、敏感信息过滤三大核心模块,实现了训练数据的全流程规范化管理,已在多个行业头部客户的AI项目中成功应用。

何冲重点分享了该方案在某大型语言模型训练项目中的实践案例。通过部署智能数据清洗和版权标记系统,将训练数据的可用率提升至92%,同时有效规避了版权争议风险。这一创新实践引发了与会者的热烈讨论。

“本次研讨会为产业界提供了宝贵的交流平台。”何冲表示,“安易信科技将持续深化数据治理技术创新,为AI产业发展提供安全可靠的数据支撑。”