采访王乐妍:北京有100多个大型模型,计算基础设施建设规划加快

日期:2023-10-17 14:13:45 / 人气:200

”“我市有100多个大型号产品,约占全国一半。“北京一直是中国人工智能产业发展的先行者和创新高地。早在8月底,北京首批5个大型模型就已备案,并陆续向市民提供服务。
近日,北京市经济和信息化局党组成员、副局长王乐妍在接受新京报贝壳财经记者采访时表示,北京各类市场主体已进入产品研发的大型号轨道,并积极推进产业化。平均每个月都有10家以上的市场主体进入大模式轨道,保持着较高的增长速度。
目前,生成式人工智能的发展仍处于初级阶段,但随着一系列“杀手级”应用的出现,其对各行各业工作方式的影响不容小觑。在王乐妍看来,科研院所和大型头部模型企业都有雄厚的资金储备和长期的技术积累。他们以技术攻关为目标,汇聚顶尖人才,着力推动大型通用模型创新突破并实现自主可控,以OpenAI对标打造大型通用模型基地。
人工智能应用纷纷涌向赛道,也有需要解决的问题。王乐妍表示,目前存在的问题包括智能计算能力资源供应紧张、优质数据资源不足、典型应用场景开放度不够等,相关政策措施正在积极推进落实,解决大规模模型开发问题。
围绕大模型“智能”高地,预计到2025年,基本形成要素齐全、技术领先、生态完整的通用人工智能大模型产业发展格局,可有力支撑北京数字经济高质量发展。
谈论市场
落地提速,平均每个月有10多个科目涌入大模赛道。
贝壳财经:目前北京人工智能产业发展现状如何,有多少大的模型产品?
王乐妍:目前,我市有100多个大型模型产品,约占全国总数的一半。
目前,大模型已经成为学术研究机构和人工智能企业关注的焦点。北京拥有丰富的人力资源、雄厚的技术力量、多样的应用场景等大型模型发展的先发优势,成为中国大型模型发展的排头兵。
今年以来,我市各类市场主体进入产品研发大型号轨道,积极推进产业化。平均每个月都有10家以上的市场主体进入大模式轨道,保持着较高的增长速度。在大规模模型蓬勃发展的同时,我们也遇到一些亟待解决的问题,包括智能计算能力资源短缺、优质数据资源短缺、典型应用场景缺乏开放性等。我们正在积极推进相关政策措施,解决大比例模型发展中存在的问题。
贝壳财经:近期国内十余家企业陆续发布通用大模型产品。如何看待一般大模型和垂直大模型的关系?
王乐妍:我们正在密切关注大模型的发展趋势,进行深入的企业调研和讨论,了解企业的发展趋势。我们可以看到,目前主要的发展方向是在一般大尺度模型的基础上,加速大尺度模型在垂直领域的应用,并取得成果。
通用大型号是大型号的应用基础,大型号企业和科研院所着力突破大型号技术能力天花板。强大的通用模型能力需要更多的预训练参数、更多的计算能力资源和更强的模型算法。这离不开数据、计算能力和人力资源的支持。科研院所和大型头部模型企业有雄厚的资金储备和长期的技术积累。他们以技术攻关为目标,聚集顶尖人才,大力推动大型通用模型的创新突破并使之自主可控,通过对标OpenAI(开发ChatGPT的人工智能研究公司),打造大型通用模型的基地。
垂直大型模型基于通用大型模型库实现下游场景的应用适配,具有行业优势的垂直大型模型企业正在探索大型模型在典型场景的应用,实现业务闭环。垂直大型模型企业在各自领域拥有相当数量的用户资源储备,可以快速获取优质的行业数据资源。利用自身在行业领域的数据沉淀优势,推动垂直细分领域垂直大规模模型的应用转化,加速大规模模型应用的落地进程。
通用大模型搭建技术基础,垂直大模型实现各行业应用,两者共同发展,推动大模型技术智能化转型。
谈论推动
政策的努力下,一批智能计算中心将于今年年底正式建成。
贝壳财经:作为中国大型车型创新基础最好、人才团队最集中、R&D能力最强、产品迭代最活跃的地区,在支持和推动行业发展方面采取了哪些措施,取得了哪些成效?
王乐妍:为支持我市通用人工智能产业发展,我市出台了《北京市加快建设具有全球影响力的人工智能创新源头实施方案(2023-2025年)》、《北京市促进通用人工智能创新发展措施》、《北京市通用人工智能产业创新伙伴计划》等政策措施。充分发挥政府的引导作用和创新平台的催化作用,整合创新资源,加强要素配置,营造创新生态,注重风险防范,促进本市通用人工智能创新导向和理性健康发展。围绕提升计算资源整体供给能力、提升优质数据要素供给能力、推动通用人工智能技术创新场景应用等方面开展工作。
在计算电源方面,积极推进人工智能计算中心项目建设。海淀人工智能计算中心、朝阳北京数字经济计算中心等项目正在加紧推进,一批智能计算中心将于今年年底正式建成;石景山、门头沟、大兴、丰台四个商用智能计算中心的建设也在积极推进中。
在数据开放方面,出台了《关于充分发挥数据要素作用进一步加快数字经济发展的实施意见》,同时积极推进优质数据资源开放。截至目前,我们已经发布了两批总量约612TB的优质数据集,帮助了大型模型企业,很多大型模型企业与数据提供商进行了合作和对接。
在企业服务和应用场景开放方面,以北京市通用人工智能产业创新伙伴计划为抓手,搭建人工智能大模型开放合作平台,建立协同合作机制,促进合作伙伴协同联动,服务本市大模型企业发展。我们通过合伙人计划积极推动行业、政务、金融、医疗、法务、消费等典型应用场景与大型样板企业的对接。截至目前,伙伴计划已组织6场50人以上的对接活动(其中2场100人以上的高规格活动),服务近200家企业,发布50个应用场景,促成13个大模式应用场景的签约合作。
我们正在积极配合政务局,加快智慧政务模式的迭代部署。在业务专家的协助下,开始加强对公积金应用、市场监管、公安交管、规划等领域的学习,积极协调计算资源,满足政务模型培训过程中的计算需求。同时,打通局内政务应用场景,探索以大模式服务智慧政务的典型经验,打造政务服务领域的标杆试点应用。
谈论挑战
为了防止潜在的相关风险,有必要加强技术安全和伦理审查。
贝壳财经:解决应用落地问题有哪些努力?
王乐妍:大模型作为人工智能最新的产业发展范式,技术门槛高,在应用过程中也存在核心资源供给不足、成本高的问题。为更好地加速垂直行业大规模模式落地,我局以“伙伴计划”为抓手,建立合作机制,促进合作伙伴的合作联动,实现资源供给丰富、应用有效、合作机制灵活的良性发展态势。
一是增强“通用大模型”基地的支撑作用,鼓励相关市场主体开放通用大模型的更高参数版本,为垂直大模型的落地应用提供更强的通用能力支撑,降低大模型落地应用过程中的整体技术门槛,避免垂直大模型企业研发带来的资金和资源浪费。
二是加快我市智能计算中心建设,为我市垂直大模型应用提供更多计算资源支持;对开展大模型应用相关工作的企业提供“计算券”补贴支持,有效降低大模型企业智能计算力使用成本。
三是创新大型模型应用落地合作机制。政府搭建平台,企业引领,引导大型样板企业和应用企业建立互利共赢的合作模式。应用企业为大型模型落地提供必要的数据资源和行业专家支持,加快大型模型在垂直领域的应用落地速度。
贝壳财经:生成式人工智能的发展也伴随着一些争议,比如版权、内容安全等。北京市经信局是否针对这些潜在的关联风险采取措施?
王乐妍:生成式人工智能的快速发展给互联网内容领域带来了深刻的变革,不仅提高了内容生成的效率和交互性,还扩大了在创意和设计领域的应用范围。但与此同时,我们需要关注技术发展带来的新挑战,如数据隐私、内容安全和伦理问题,我们需要加强技术治理和社会监督。
今年7月,国家网信办联合多部委颁布《生成式人工智能服务管理暂行办法》,明确生成式人工智能服务提供者应当依法开展预训练、优化训练等训练数据处理活动,使用具有合法来源的数据和基础模型;涉及知识产权的,不得侵犯他人依法享有的知识产权;涉及个人信息的,应当取得个人同意或者符合法律、行政法规规定的其他情形;采取有效措施提高培训数据质量,增强培训数据的真实性、准确性、客观性和多样性。
组织开展政策解读活动,邀请国家互联网应急中心技术专家和中科院人工智能专家深入解读《办法》出台背景、法律责任、合规义务、发展指引等内容,就提供者和使用者责任界定、模型开源管理、数据标注等关键环节进行答疑解惑,有效回应企业关切。
我们认为,鉴于生成式人工智能潜在的关联风险,需要通过制定和完善相关法律法规、加强技术安全和伦理审查、建立和完善评价体系、增强用户安全意识等措施来防范相关风险。通过各项措施的实施,共同推动生成式人工智能技术的健康发展。
谈规划
抢占高地,建立多部门联合的大样板评估体系
贝壳财经:未来有什么推动大模型行业发展的计划?
王乐妍:以场景应用为导向,我市将聚集产业链上下游合作伙伴,加快大型模型产业应用,赋能万千产业向智能化转型,打造具有国际影响力的人工智能大型模型产业高地。预计到2025年,基本形成要素齐全、技术领先、生态完整的通用人工智能大模型产业发展格局,可有力支撑北京数字经济高质量发展。着眼长远,从算力、算法、数据、治理等方面共同努力,加速中国自主大模型的创新迭代,加快典型应用场景的落地,夯实我市数字经济产业基础。
多维度提升城市的计算供电能力。一是加快编制全市计算力基础设施建设规划,进一步完善全市计算力中心建设和计算力供应体系,按照统筹规划、优势互补的原则,构建以智能计算力为主体、通用计算力和超算力协调发展的计算力供应体系,积极引导计算力资源在功能和空间上实现梯度分布,努力提高网络承载能力,推进计算力中心绿色高效、安全可控。二是同步研究京津冀计算力调度平台建设,力争实现区域计算力资源动态统筹,提升北京周边计算力综合服务能力,形成全国计算力网络调度枢纽节点。三是加大高性能计算芯片生态建设,积极推进国产化适配,支持研发一批具有自主可控能力的图形GPU和通用GPU,保障我市人工智能产业供应链的韧性和安全水平。目前正在大力推进公共计算中心建设,积极引导老旧小型数据中心向智能计算中心转型升级。我局已与河北、内蒙古签署合作协议,鼓励企业建设专门面向北京市场的智能计算中心。
通过多种措施增加对开源数据集的支持。一是以数据基础体系试点示范区为基础,制定国家数据培训基地建设方案,解决数据数量相对匮乏、质量保障困难、采集标注成本高、合规使用等问题,按照监管沙盒机制开展数据交易,完善政府公共数据资源开放清单,研究推出白名单战略,向白名单企业开放高价值数据资源。二是建设重点行业公共数据开放平台,建立医疗、教育、政务、金融等场景的数据供应商和用户权益体系,推动公共数据与社会数据尤其是重点企业语料库的合作,形成高质量数据集。三是支持数据标注行业高质量发展,培养高水平的数据标注团队,满足大规模模型优化对行业数据范围广、质量高的要求。
在多个领域培育行业应用生态。加快编制医疗、政务、金融等重点行业垂直领域大模型应用工作方案,在智能分诊、诊后随访、政务服务、政策咨询、金融风控等领域选择一批应用场景,按照尽职免责原则开展试点示范应用,加强成果评估。系统解决大模型推广应用过程中存在的通用大模型开源难、专业数据资源开放难、智能计算能力资源获取难、商业化难等问题,尽快加快大模型在各类典型应用场景的标杆应用,推动形成商业化闭环。
多部门联合建立大型模型评估体系。协调相关行业主管部门和权威机构,讨论建立大型模型安全技术评估体系,根据相关评估指标对大型模型产品进行测试和评估。建立评估工作组,定期围绕真实应用场景模型产生的成果开展质量评估,推动大型模型产品的安全合规发展,为大型模型产品的最终审批提供依据,促进大型模型的商业化。
通过多种渠道宣传生殖人工智能的伦理和安全相关政策。时刻关注科技伦理、科技安全领域的法律法规,与市委网信办保持密切沟通,共同组织相关政策宣传,引导企业安全合规发展。
今年以来,我市各类市场主体进入产品研发大型号轨道,积极推进产业化。平均每个月都有10家以上的市场主体进入大模式轨道,保持着较高的增长速度。在大规模模型蓬勃发展的同时,我们也遇到一些亟待解决的问题,包括智能计算能力资源短缺、优质数据资源短缺、典型应用场景缺乏开放性等。我们正在积极推进相关政策措施,解决大比例模型发展中存在的问题。
新京报贝壳财经记者陈伟成编辑王金玉校对傅春雨”

作者:蓝狮娱乐注册登录平台




现在致电 8888910 OR 查看更多联系方式 →

COPYRIGHT 蓝狮娱乐 版权所有