大数据一日入门活动成功举办!

     201711月19号下午,ifLab (健翔桥)在社团实验室举办了一日入门讲座系列之大数据。该讲座由胡川、张育萌两位导师共同主持。

上午
    胡川导师给大家进行了关于大数据的理论介绍,包括:定义,历程,应用。

张育萌导师讲解了常用的基础知识包括:git、python、linux 。

短暂的休息后,张育萌导师继续介绍了云计算/云服务器、比较了虚拟机和docker;讲解了,接口与ibm waston;以及服务计算web2.0的发展。

下午
    胡川导师以Hadoop为经典案例,进入大数据的实战讲解。分析了mapreduce计算框架和HDFS文件管理框架。

    接着,展示了wordcount 实例以及Hadoop的生态圈。重点补充了 CAP理论和数据库的知识,以Cassandra等为例子简单介绍。

数据可视化等细节掠过之后,两位导师对同学们的疑问进行了回答,圆满完成本次活动。

机器学习一日入门圆满结束

11月5日上午,我社团在网管中心实验室举行了本学期第二次“一日入门”活动,这次活动由社团导师付尧主持,主要内容涉及到机器学习中非常经典的模型——决策树。在活动前半程,介绍了决策树的相关概念,并以讲解代码的形式对决策树的构建过程做了详细的分析和讲解。

 

随后大家讨论了决策树在实际应用中的优劣,引出了决策树的改进模型——GBDT、随机森林等模型。付尧向大家介绍了这些改进模型的原理与改进点,并结合实际例子讲解这些模型为什么能够增强自身的效果。

在大家对模型相关概念都有了一个大体上的了解后,付尧为大家在电脑上演示了如何使用Python机器学习算法库——sklearn调用决策树以及其改进算法。并使用Python图形库绘制决策树的图形,以便于大家更好地理解决策树的构建过程。

接下来到了兑现活动预告里诺言的时刻了…..付尧简单讲述了对抗神经网络(GAN)的相关概念,接下来为大家演示了使用对抗神经网络生成动漫妹子头像的demo。首先使用爬虫在动漫网站中收集了5万张二次元妹子的图片,然后使用openCV库中的方法对图像进行了切割,提取图像中的妹子头像,然后将这些图像作为样本输入到对抗神经网络中,生成了新的图片。在场的同学对这个demo非常感兴趣,对人工智能的“神奇”应用发出赞叹。

在活动进入尾声时,付尧与大家探讨了机器学习的前景及发展,对有志于机器学习的同学给出了基础入门的学习路径,并对相关同学的疑问做出了指导与解答。