市场上现有大数据人工智能教研解决方案情况调研
1)虚拟机技术
在CSDN等课程平台上的很多大数据相关课程使用这种技术,不少高校也采用这种技术;这是松鼠学苑的第一代产品,https://edu.csdn.net/course/detail/24205。
这种技术主要的弊端在于:1、保存、创建虚拟机困难。2、每一个阶段有一个虚拟机镜像,需要几十个G,耗费资源非常大,学生不易管理。3、管理集群状态与一致性困难。
因此,这种解决方案不能给学生实战平台,只是在理论层面上的一种灌输,学生无法通过有效的实操搞清楚大数据基础设施的一系列框架的原理以及这些框架的关联关系,很难培养出中高端人才。
这种技术的优势:成本低,几乎没有软硬件的投入。
2)虚拟桌面解决方案
这种解决方案需要学生自己去搭建,是单机版、模拟版的,效果达不到,只能最简单的模拟,不能做集群的模拟,与工业级应用之间存在差距,影响学生就业竞争力。此外,这种解决方案传输的是视频流,带宽要求高。
这种技术的优势:已有成熟的云桌面产品;这是松鼠学苑的第二代产品。
3)云原生解决方案
弊端:学生需要操作服务厂商提供的云服务管理组件、如端口与权限,这极大的增加了学习门槛而不是将专业实训聚焦在课程本身上;而且,由于大数据人工智能系统中组件与服务众多,往往需要更为”本地”的环境,如localhost、hostname,云原生的解决方案很难满足这种情况。
这种解决方案通常是给从业人员做测试环境用的,大厂商为了快速占领市场简单粗暴的将其铺展到高校。
这种技术的优势:公有云唾手可得。
4)大集群、多租户的工业集群
弊端:不能修改集群的配置信息,做不了大数据人工智能的原理教学;共享式的集群环境,操作带有差异,如删除hdfs中某个文件的含义是删除每个学生自己定义的某个目录下的某个文件、而独立集群则保持了教材上操作指令对所有学生的一致性。
这种技术的优势:有IT支撑业务的企业基本会采用这类成熟解决方案,因此这种解决方案零研发投入;现在基本上没有高校引入这种方案。