腾讯Angel平台 1.0官方正式版

2023-04-09发布者:ylm大小: 下载:0

文件大小:

软件介绍

腾讯Angel平台是腾讯大数据官方推出的第三代计算平台,采用参数服务器架构,优化上一代框架的扩展性问题,基于腾讯内部的海量数据进行了反复的调优,适用范围广、稳定性好。腾讯angel平台功能强大,甚至支持十亿级别维度的模型训练。

  Angel 的核心设计理念围绕模型。它将高维度的大模型合理切分到多个参数服务器节点,并通过高效的模型更新接口和运算函数,以及灵活的同步协议,轻松实现各种高效的机器学习算法。

  Angel 基于 Java 和 Scala 开发,能在社区的 Yarn 上直接调度运行,并基于 PS Service,支持 Spark on Angel,未来将会支持图计算和深度学习框架集成。

  版本特性:

  1.ParameterServer 功能

  基于 Matrix/Vector 的模型自动切分和管理,兼顾稀疏和稠密两种格式

  支持对 Model 进行 Push 和 Pull 操作,可以自定义复杂的 psFunc

  提供多种同步控制机制(BSP/SSP/ASP)

  2. 开发运行

  语言支持:系统基于 Scala 和 Java 开发,用户也可以自由选择

  部署方便:可以直接在 Yarn 社区版本中运行,也支持本地调试模式

  数据切分: 自动切分读取训练数据,默认兼容了 Hadoop FS 接口

  增量训练:训练过程中会自动 Checkpoint,而且支持加载模型后,增量训练

  3.PS Service

  只启动 PSServer 和 PSAngent,为其他分布式计算平台提供 PS 服务

  基于 PS-Service,不需要修改 Spark 核心代码,直接开发 Spark-on-Angel 算法,该模式无缝支持 Breeze 数值运算库

  4. 算法库

  集成 Logistic Regression,SVM,KMeans,LDA,MF,GBDT 等机器学习算法

  多种优化方法,包括 ADMM,OWLQN,LBFGS 和 GD

  支持多种损失函数、评估指标,包含 L1、L2 正则项

  5. 算法优化

  LDA 采用了 F+LDA 算法用于加速采样的速度,同时利用流式参数获取的方法减少网络参数获取的延迟

  GBDT 使用两阶段树分裂算法,将部分计算转移到 PS,减少网络传输,提升速度

发表评论(共0条评论)
请自觉遵守互联网相关政策法规,评论内容只代表网友观点,发表审核后显示!

版权声明:

1 本站所有资源(含游戏)均是软件作者、开发商投稿,任何涉及商业盈利目的均不得使用,否则产生的一切后果将由您自己承担!

2 本站将不对任何资源负法律责任,所有资源请在下载后24小时内删除。

3 若有关在线投稿、无法下载等问题,请与本站客服人员联系。

4 如侵犯了您的版权、商标等,请立刻联系我们并具体说明情况后,本站将尽快处理删除,联系QQ:2499894784

返回顶部