点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:油气大模型破局需从三方面发力
首页> 数字化频道> 评论观察 > 正文

油气大模型破局需从三方面发力

来源:科技日报2024-10-23 19:09

  在人工智能技术日新月异的今天,生成式人工智能的代表——ChatGPT的横空出世,不仅在短时间内吸引了全世界关注的目光,更激发了各行业对大型预训练模型的无限遐想。油气行业作为国民经济的支柱之一,同样期待它能为油气勘探、开发带来新变革。尤其是随着国内油气资源品质逐步劣质化,油气勘探开发难度逐渐加大,亟须运用新技术提质增效。

  油气大模型应用面临挑战

  数据、算力和算法是大模型发展的核心要素。其中,数据是大模型应用的基石,算力是大模型应用的保障,算法是大模型应用的工具。由于油气行业具有特殊性,在上述三个层面,油气大模型开发都面临着诸多挑战。

  在数据方面,油气大模型应用面临数据稀缺、复杂和安全性的挑战。一是油气行业的数据涵盖了地质勘探、钻井、生产和运输等多个环节,每个环节的数据采集都伴随高昂的成本,样本数量少且获取非常困难,采集回的数据还具有多解性和不可验证性的特点。二是油气行业的数据类型非常多样化,处理这些不同种类、不同版本、不同结构的数据本身就充满挑战。三是大模型需要学习海量数据,但油气行业对数据的安全性和保密性有着极高的要求,数据不能上传公有云,且必须防止泄露,因此普遍存在“数据孤岛”问题。这一现状使得如何在保障数据安全前提下,整合分散的数据并训练行业基础模型,成为油气行业大模型应用的关键难题。

  在算力方面,油气大模型的训练和优化也面临着算力资源不足的挑战。大模型的训练和优化通常需要巨大的算力资源,这往往伴随着相当高的投入成本。自建算力中心需要巨额资金投入,而租赁算力又存在数据安全和隐私保护的问题。目前,国内油气行业仅具备有限的微调算力,普遍不具备训练行业基础模型所需的高水平算力。此外,由于各种原因,国内油气行业在短期内很难建立起满足大模型需求的算力资源。这一问题进一步加剧了算力资源的短缺,使得大模型的应用和发展受到严重制约。

  在算法方面,油气大模型也面临版权纠纷等挑战。算法的优劣直接影响大模型的实际应用效果。相较于传统深度学习等算法,大模型的技术门槛更高,目前的发展主要依赖少数高端算法人才推动。尽管许多开源大模型算法可以作为研发基础,但它们可能缺乏必要的技术支持和安全保障,存在商业机密泄露的风险,且其能力往往不如闭源算法。此外,开源算法的版权协议中存在诸多限制条款,使得基于开源算法进行研发时可能面临版权纠纷。如果选择使用闭源算法,则难以实现核心算法的自主可控。

  从数据、算力和算法入手推动大模型应用

  油气大模型应用并非坦途,需要在数据、算力和算法等方面破局。

  首先,数据之困需破冰。面对数据采集高成本与复杂性并存的挑战,破解数据之困,要以大模型应用为契机,推动数据治理,确保数据的全面性、准确性和时效性。油气行业在大模型方面的核心竞争力是“行业数据”,要做好“训练样本库”的基本功。油气企业必须强化数据全生命周期管理,从数据源头、数据采集、数据清洗、数据融合和匹配、数据完整性增强、数据标注等环节严格规范,建立高质量的训练样本库,提升数据治理能力,为模型提供坚实的数据基础。同时,应通过数据脱敏、数据加密、访问控制和审计、合规性审查等方式加强数据安全和隐私性保护。如设置合适的权限和用户角色,限制用户对数据库的访问和操作,保护数据的安全性。还需进行数据库的维护和优化工作,包括定期备份、数据清理、性能监控等。在此前提下,构建一批高质量开源数据集,推动油气大模型研发生态建设。

  其次,算力建设应灵活。面对资金投入与隐私保护之间平衡的挑战,破解算力之困,应以油气大模型为契机,推动融合算力建设。可采取租赁与自建相结合的方式,注重智算能力建设的同时,加强数据安全与隐私保护。例如,企业应根据自身业务需求、成本预算和技术实力,灵活选择算力获取方式。对于常规的计算任务,可通过租赁公有云资源快速响应;而对于涉及敏感数据或需长期稳定运行的任务,则可考虑自建或合作共建数据中心,确保数据安全与算力的可持续供给。在算力设施规划上,应注重长远,实现通用计算、智能计算和高性能计算的融合布局,通用计算满足日常运营的基本计算需求,智能计算侧重于深度学习、机器学习等智能算法的高效执行,高性能计算则针对大规模科学计算和复杂模拟,满足不同场景的需求,显著提高算力资源的利用效率。

  此外,算法创新勿盲从。面对大模型训练周期长与迭代速度快的双重考验,破解算法之困,应量身定做适合行业特性的算法模型,避免盲目跟风。应理性认识大模型的价值,优先实施场景模型和数据质量优良的L2行业基础模型,重点应放在微调和适配下游任务上,避免盲目投入通用基础模型的研发,确保技术栈的自主可控。油气行业应秉持资源优化配置的原则,聚焦油气主营业务,从投入成本、产出效益、技术成熟度,以及稳定性、行业聚焦、核心竞争力等方面慎重考虑。在岩心分析、地震资料处理解释、测井数据分析等特定领域,大模型能发挥显著作用,但不可过度依赖,应明确模型的适用范围。

  为了推动大模型技术的自主可控,还需加强“AI+能源”复合团队的建设。训练、应用大模型不能闭门造车,要打破传统行业壁垒,注重联合研发生态的建设,例如推动油气行业与互联网企业、高校等的合作,促进跨学科人才整合,形成产学研用紧密结合的创新体系,为油气大模型应用构建可持续的人才保障。同时,可通过项目合作、人才培养、共建研发平台等方式加强大模型算法等方面的合作交流,并明确合作目标与分工,以及知识产权分配与管理、数据保密和隐私保护等制度和规范。

  大模型必将推动油气行业新质生产力发展,未来可期,但道阻且长。油气行业要充分认识油气大模型的特殊性,从数据、算力、算法等方面做好工作,稳扎稳打,逐步推进,让AI成为推动油气行业转型升级的重要驱动力。

  (作者:刘合 中国工程院院士、中国石油勘探开发研究院正高级工程师)

[ 责编:刘昊 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 乙巳年黄帝故里拜祖大典在河南新郑举行

  • 上海:纪念五卅运动100周年文物史料专题展开幕

独家策划

推荐阅读
用镜头记录城市更新 青岛首届“百家媒体看改变”活动圆满闭幕
2025-03-20 10:14
"昭君杯"首届全国老年合唱大赛在北京国家大剧院正式启动
2025-03-19 16:10
2025年2月25日,云南省昭通市绥江县,新市金沙江特大桥施工现场,工人正加紧施工。
2025-02-26 15:41
2025年2月7日,重庆市巫山县曲尺乡月明村一大片梅花竞相开放、灿若红霞,游客和市民前来游玩打卡,尽享春日的快乐和惬意
2025-02-08 14:52
2025年2月5日,福建省福清市石竹山风景区,一场非遗英歌舞、建瓯挑幡等非遗表演正在进行,让游客感受中华优秀传统文化魅力,丰富景区文化内涵和游览品质
2025-02-06 15:55
2025年1月20日,江西省赣州市章贡区城市中央公园内,游船与湖水、植被、高楼相互映衬,呈现出一幅冬日多彩美丽生态画卷
2025-01-20 15:30
2025年1月16日,受低温天气影响,山西省运城盐湖出现冬季独特的“硝花”景观,水面上的硝花形态各异晶莹剔透,美不胜收。
2025-01-16 15:56
一位“行者”行走在广袤的沙漠中,遮掩着绝世的面庞,一面“古镜”掩埋于厚重的沙下,刻满了时间的裂痕。
2025-01-13 17:25
2025年1月9日,重庆市酉阳土家族苗族自治县桃花源国家森林公园白雪皑皑,雪景如画
2025-01-09 15:24
关爱卡寒假公益行 助力云南各族青少年儿童梦想起航
2025-01-08 14:42
2025年1月5日,在山西太原南站开往呼和浩特东站的D4022次列车前,游客自拍合影。
2025-01-06 16:01
2024年12月8日,广西梧州岑溪市岑城镇木榔村,生态田园中阡陌纵横线条分明,冬韵如画。
2024-12-10 16:48
2024年12月10日,贵州省黔西市绿化白族彝族乡大海子村,青山环绕树木葱茏,构成一幅美丽的生态画卷。
2024-12-10 16:40
2024年12月6日,古城苏州街头,成片的银杏、红枫等树木色彩斑斓满目缤纷,成为一道迷人的风景。
2024-12-06 15:48
2024年12月6日,初冬时节,山东省青岛市即墨区灵山街道花卉种植基地的大棚里一片繁忙,种植户忙着管护花卉。
2024-12-06 15:48
2024年11月30日,初冬时节,河南省南阳卧龙岗文化园内,树木换上"新装",宛如一幅五彩斑斓的画卷,吸引不少市民、游客前往赏景。
2024-11-30 18:34
民以食为天,一日三餐承载着居民的幸福感。
2024-11-27 18:59
政协协商与基层社会治理的衔接,可实现协商于民协商为民,让全过程人民民主更好的在基层体现。
2024-11-24 22:51
11月12日至13日,浏阳市委常委、组织部部长、市家居建材产业链链长唐安石带队,市人大常委会党组副书记、副主任、市家居建材产业链副链长张葵红,市人民政府党组成员、副市长、市家居建材产业链副链长谢波等同志参加,赴广东省佛山市开展家居建材产业链招商考察活动。
2024-11-15 17:20
2024年11月12日,江苏省苏州市荷塘月色湿地公园内向日葵竞相绽放,吸引众多游客前来观赏,乐享秋日美景
2024-11-13 15:29
加载更多