联系我们
关注我们
顶部
安擎机器学习平台——挖掘数据之美
发表日期:2019-01-22
       安擎机器学习平台是安擎计算机有限公司自主研发的一套基于GPU服务器集群的用于深度学习的资源管理平台软件。它将GPU资源、CPU资源、内存、硬盘等资源虚拟化后进行统一管理,按需分配给不同用户和群组使用。安擎机器学习平台搭载安擎服务器,已经在多家高等院校、科研院所、AI初创公司甚至科技制造产线等企事业单位投入运行。
 
机器学习理论与算法

      机器学习,是实现人工智能的一个途径,即以机器学习为手段解决人工智能中的问题。作为人工智能的分支,机器学习在近30多年已发展为一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。
机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。
 
      机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为涉及大量统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的、行之有效的学习算法。

     机器学习已广泛应用于数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人等领域。

数据挖掘经典故事:啤酒与尿布故事
   
       20世纪90年代的美国沃尔玛,将美国学者Agrawal在1993年提出的A prior算法(从数学及计算机算法角度找出商品关联关系,并根据商品之间的关系找出客户的购买行为的算法)引入到超市POS机数据分析中,发现了一个独特的现象:

      “啤酒”与“尿布”两件看上去毫无关系的商品经常出现在同一个购物篮中。经过后续调查发现,这种现象出现在年轻的父亲身上。在美国有婴儿的家庭中,一般是母亲在家中照看婴儿,年轻的父亲前去超市购买尿布。父亲在购买尿布的同时,往往会顺便为自己购买啤酒,这样就会出现啤酒与尿布这两件看上去不相干的商品经常会出现在同一个购物篮的现象。于是沃尔玛开始在卖场尝试将啤酒与尿布摆放在相同的区域,让年轻的父亲可以同时找到这两件商品,并很快地完成购物,从而获得了很好的商品销售收入,这就是“啤酒与尿布”故事的由来。


安擎机器学习平台成长之路:

      ·2017-12-16:V1.7版本:机器学习平台最初版本正式发布;
      ·2018-01-17:发布V2.0版本:增加查看网页。用户可以登录网页实时监控服务器实用情况;
      ·2018-02~07:发布V2.1-2.7版本:陆续完善各模块功能(存储、授权管理、集群部署、用户管理、应用管理);
      ·2018-10-31:发布V3.0版本:【Deploy-v2.0版本】支持单节点部署;
      ·2018-11-06:【Deploy-v2.1版本】支持外接存储服务器(IP-SAN配置);
      ·2018-12-25:【Deploy-v2.2版本】更新支持GPU卡类型(包括NVIDIA GeForce RTX 2080和2080Ti);
 
安擎机器学习平台特色功能:

      集群部署:一键式部署(支持单节点部署),节点扩容,日志查看
      应用管理:多种机器学习框架镜像定制(cuda9.0/10.0、caffe、tensorflow、torch);支持当前各类主流显卡(2080Ti,2080,1080Ti,1080,P100,V100等);秒级创建应用,图形化界面容器
      授权管理:授权用户使用期限
      用户管理(创建群组/用户,分配CPU、GPU、配额)多用户使 用集群,资源利用最大化
      存储管理:监控服务器硬盘使用情况,支持不同形式的卷,用于存储和镜像库。支持外接存储服务器(IP-SAN配置)
      系统监控:监控服务器资源(CPU、GPU、内存)使用状态以及集群状态
      文件管理:存储数据、不同用户之间资源共享以及容器内外部文件传输
      附加功能:收集日志,系统升级
 

 
   
       安擎机器学习平台搭载安擎服务器,已经在多家高等院校、科研院所、AI初创公司甚至科技制造产线等企事业单位投入运行,凭借“一键式部署”、“多种机器学习框架镜像定制”等特色功能,安擎计算机已经为多家科研单位节约了深入人工智能领域的时间和人力成本,使其聚焦深度学习算法,加快科研速度;为多家科技企业降低技术门槛,提高IT设备利用率。
 
       相信在2019、在未来,安擎将继续以软硬件结合为方针,以企业客户的需求为导向,审时度势,顺应时代发展潮流,研发和生产出更多贴近客户需求的软硬件产品。