# Datawhale_Learning **Repository Path**: yan_feitian/Datawhale_Learning ## Basic Information - **Project Name**: Datawhale_Learning - **Description**: Datawhale_Learning涵盖了AI领域从理论知识到动手实践的学习内容 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 0 - **Created**: 2020-06-24 - **Last Updated**: 2021-09-10 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Datawhale组队学习计划 Datawhale是一个开源的AI学习社区,致力于构建一个纯粹的学习圈子,帮助学习者更好的成长,组队学习计划的内容为Datawhale成员根据AI领域优秀的学习资料所设计的。内容覆盖编程基础、数学基础、数据科学、机器学习、深度学习、理论应用等AI领域,我们不是内容的产生者,我们向优秀的资料和优秀的学习者致敬。 # 官方指南 ## 组队学习内容设计教程 1. [如何参与组队学习内容设计](./wk/组队学习内容设计流程/如何参与组队学习的内容设计.md) 2. [如何提交组队学习内容设计以及后续内容优化](./wk/组队学习内容设计流程/如何提交组队学习内容设计以及后续内容优化.md) 3. [如何审核组队学习课程内容]() 4. [组队学习内测流程](./wk/组队学习内容设计流程/组队学习内测流程.md) 5. [组队学习内容设计相关模板](./wk/组队学习内容设计模板/) # 合作伙伴 合作事宜请扫描请关注公众号,联系管理员 # 组队学习内容列表 ## 编程基础 ### 数据结构与算法(原 编程) * 内容设计: * 光城 、LeoLRH、 肖然 * 学习目标 - 知道 基本的数据结构概念与算法思想 - 了解 各种数据结构的实现方式,算法思想的使用场景 - 理解 数据结构之间的使用场景,算法的实现方式 - 掌握 各种数据结构的实现,以及相关数据结构的操作(增删改查) * 学习内容 - 数组 → 链表 → 栈 → 队列 → 递归 → 排序 → 二分查找 → 哈希表 → 字符串 → 二叉树 → 堆 → 图 → 回溯 → 分治 → 动态规划 * 基本信息 * 定位人群:具有一定编程语言基础; * 时间安排:33天,2-3h/天 * 学习类型:理论学习,实践 * 先修组队学习:无 * 后续推荐组队学习:LeetCode * 难度系数:高
任务安排 - 学习任务 阶段一 - Task1:[数组(2天)](doc/编程基础/数据结构与算法/学习任务V2-1/Task%201:数组(2天).md) - Task2:[链表(2天)](doc/编程基础/数据结构与算法/学习任务V2-1/Task%202:链表(2天).md) - Task3:[栈(2天)](doc/编程基础/数据结构与算法/学习任务V2-1/Task%203:%20栈%20%20(2天)%20.md) - Task4:[队列+递归(3天)](doc/编程基础/数据结构与算法/学习任务V2-1/Task%204:队列%20+%20递归%20(3天)%20.md) - Task5:[排序(3天)](doc/编程基础/数据结构与算法/学习任务V2-1/Task%205:排序%20(3天).md) - Task6:[二分查找(2天)](doc/编程基础/数据结构与算法/学习任务V2-1/Task%206:二分查找%20(2天).md) - 学习任务 阶段二 - Task7:[散列表(哈希表)(3天)](doc/编程基础/数据结构与算法/学习任务V2-2/Task7:散列表(哈希表)(3天).md) - Task8:[字符串(2天)](doc/编程基础/数据结构与算法/学习任务V2-2/Task%208:字符串%20(2天)%20.md) - Task9:[二叉树(2天)](doc/编程基础/数据结构与算法/学习任务V2-2/Task%209:二叉树%20(2天)%20.md) - Task10:[堆(2天)](doc/编程基础/数据结构与算法/学习任务V2-2/Task%2010:%20堆%20(2天)%20.md) - 学习任务 阶段三 - Task11:[图(4天)](doc/编程基础/数据结构与算法/学习任务V2-3/Task%2011:图%20(4天).md) - Task12:[递归+回溯+分治(3天)](doc/编程基础/数据结构与算法/学习任务V2-3/Task%2012:递归%20+%20回溯%20+%20分治%20%20(3天).md) - Task13:[动态规划(3天)](doc/编程基础/数据结构与算法/学习任务V2-3/Task%2013:动态规划%20(3天).md)
### leetCode * 内容设计: * 老表、于鸿飞、杨皓博 * 学习目标 - 能够熟练的使用LeetCode刷题,提高自身的coding能力 * 学习内容 - 腾讯精选练习(50题)顺序每天一道题 * 基本信息 * 定位人群:具有一定编程语言基础; * 时间安排:50天,2-3h/天 * 学习类型:刷题实践 * 先修组队学习:数据结构与算法 * 后续推荐组队学习: * 难度系数:中
任务安排 * 选取腾讯精选练习(50 题)解答,每天1题 * 链接:https://leetcode-cn.com/problemset/50/
# 基础知识 ### 统计学 * 内容设计: * 王佳鑫、许辉 * 学习目标 - 掌握 中心极限定理、置信区间、 假设检验、二项及泊松分布、大数定律、正态分布 * 学习内容 - 统计学基本知识→二项及泊松分布→大数定律→正态分布→中心极限定理→置信区间→假设检验等 * 基本信息 * 定位人群:具有一定微积分、基本概率知识储备; * 时间安排:12天,2-3h/天 * 学习类型:理论学习 * 先修组队学习:无 * 后续推荐组队学习:初级算法梳理 * 难度系数:中
任务安排 - Task1:[统计学基本知识+二项及泊松分布+大数定律+正态分布(3天)](doc/基础知识/统计学/学习任务/Task1.md) - Task2:[中心极限定理+置信区间(3天)](doc/基础知识/统计学/学习任务/Task2.md) - Task3:[假设检验(3天)](doc/基础知识/统计学/学习任务/Task3.md) - Task4:[线性回归+卡方分布+方差分析(3天)](doc/基础知识/统计学/学习任务/Task4.md)
### Python * 内容设计: * 马晶敏、叶梁 * 学习目标 - 知道 python的环境搭建 - 了解 python的数据类型的相关知识 - 理解 函数的概念及相关用法 - 掌握 python类和对象用法 * 学习内容 - 基础知识→函数→第三方模块→类和对象 * 基本信息 * 定位人群:python小白; * 时间安排:13天,3-4h/天 * 学习类型:代码实战+整理 * 先修组队学习:无 * 后续推荐组队学习:数据分析 * 难度系数:低
任务安排 - Task1:[环境搭建+python初体验+python基础讲解+ python数值基本知识(2天)](doc/基础知识/Python/学习任务/Task1.md) - Task2:[列表+元组+string字符串+字符串格式化问题(2天)](doc/基础知识/Python/学习任务/Task2.md) - Task3:[数组+集合+判断语句+三目表达式+循环语句(2天)](doc/基础知识/Python/学习任务/Task3.md) - Task4:[函数关键字+定义+参数与作用域+返回值+file+os模块(2天)](doc/基础知识/Python/学习任务/Task4.md) - Task5:[类和对象+正则表达式+re模块+ datetime模块+http请求(2天)](doc/基础知识/Python/学习任务/Task5.md) - Task6:[飞机大战(3天)](doc/基础知识/Python/学习任务/Task6.md)
# 数据科学 ### Excel * 内容设计: * 杨煜、李严 * 学习目标 * 了解 Excel的界面构成 * 了解 Excel常用函数 * 熟练 掌握透视表以及绘图 * 掌握 Excel函数的配合使用 * 学习内容 * 基础界面&基础文件操作→基础函数→查找函数vlookup和match/index→基础图表→数据透视表 * 基本信息 * 定位人群:小白; * 时间安排:12天,2-3h/天 * 学习类型:理论,案例实操 * 先修组队学习:无 * 后续推荐组队学习:MySQL、Python、数据分析等 * 难度系数:低
任务安排 - Task1:[基础界面(2天)](doc/数据科学/Excel/学习任务V2/Task1.md) - Task2:[基础函数(2天)](doc/数据科学/Excel/学习任务V2/Task2.md) - Task3:[match index 和vlookup函数 和双条件查找匹配 (2天)](doc/数据科学/Excel/学习任务V2/Task3.md) - Task4:[基础图表(4天)](doc/数据科学/Excel/学习任务V2/Task4.md) - Task5:[数据透视表(2天)](doc/数据科学/Excel/学习任务V2/Task5.md)
### 数据分析 * 内容设计: * 金娟娟 * 学习目标 - 掌握 numpy、pandas、matplotlib等的使用及python数据分析处理 * 学习内容 - numpy→pandas→matplotlib→seaborn→时间序列 * 基本信息 * 定位人群:有一点python基础,但不太会python库的数据分析小白; * 时间安排:22天,2-4h/天 * 组队学习类型:理论,案例实操 * 先修组队学习:python * 后续推荐组队学习:数据挖掘 * 难度系数:中
任务安排 - Task0:[github+jupyter(1天)](doc/数据科学/数据分析/学习任务v2/Task0.md) - Task1:[第4章numpy+作业1(2天)](doc/数据科学/数据分析/学习任务v2/Task1.md) - Task2:[第5章pandas(2天)](doc/数据科学/数据分析/学习任务v2/Task2.md) - Task3:[第6章数据载入(2天)](doc/数据科学/数据分析/学习任务v2/Task3.md) - Task4:[第7章数据清洗(2天)](doc/数据科学/数据分析/学习任务v2/Task4.md) - Task5:[第8章数据联合(2天)](doc/数据科学/数据分析/学习任务v2/Task5.md) - Task6:[第10章数据聚合(2天)](doc/数据科学/数据分析/学习任务v2/Task6.md) - Task7:[第12章高阶pandas(2天)](doc/数据科学/数据分析/学习任务v2/Task7.md) - Task8:[第9章matplotlib(2天)](doc/数据科学/数据分析/学习任务v2/Task8.md) - Task9:[第11章时间序列大作业(2天)](doc/数据科学/数据分析/学习任务v2/Task9.md) - Task10:[大作业+总结(3天)](doc/数据科学/数据分析/学习任务v2/Task10.md)
### MySQL * 内容设计: * 杨皓博 孙涛 杨煜 * 学习目标 - 知道 数据库构成要素 - 了解 数据库发展历程 - 理解 数据库表基本要素 - 掌握 MySQL语句语法和常用写法 * 学习内容 - MySQL软件安装及数据库基础→查询语句→表操作→表联结→MySQL 实战→MySQL实战-复杂项目 * 基本信息 * 定位人群:小白; * 时间安排:11天,2-3h/天 * 组队学习类型:理论、刷书、刷题 * 先修组队学习:无 * 后续推荐组队学习:Python相关的组队学习 * 难度系数:低
任务安排 - Task1:[软件安装及数据库基础+MySQL 基础 +项目【查找重复的电子邮箱,查找大国】(3天)](doc/数据科学/MySQL/学习任务V2/MySQL任务1%20-%203天.md) - Task2:[MySQL 基础 (二)- 表操作【三个项目】+表联结【四个项目】(4天)](doc/数据科学/MySQL/学习任务V2/MySQL任务2%20-%204天.md) - Task3:[MySQL 实战 - 6个项目(2天)](doc/数据科学/MySQL/学习任务V2/MySQL任务3%20-%202天.md) - Task4:[MySQL 实战 - 5个复杂项目(2天)](doc/数据科学/MySQL/学习任务V2/MySQL任务4%20-%202天.md)
### 爬虫 * 内容设计: * 光城、李方 * 学习目标 - 知道 Robots协议、http与https的区别 - 了解 网页构造、爬虫往后所需的知识 - 理解 请求头的作用、网络请求的过程 - 掌握 Requests、Lxml、Selenium、BeautifulSoup常用方法 * 学习内容 - 请求 & 正则表达式 → beautifulsoup & lxml → selenium & IP问题 → 实战大项目 * 基本信息 * 定位人群:有基础的Python编程能力和一些网络常识; * 时间安排:8天,2-3h/天 * 组队学习类型:理论+实践 * 先修组队学习:无 * 后续推荐组队学习:数据分析 * 难度系数:中
任务安排 - Task1:[get与post请求+正则表达式(2天)](doc/数据科学/爬虫/学习任务/Task1.md) - Task2:[beautifulsoup+xpath(2天)](doc/数据科学/爬虫/学习任务/Task2.md) - Task3:[selenium+IP(2天)](doc/数据科学/爬虫/学习任务/Task3.md) - Task4:[实战大项目(2天)](doc/数据科学/爬虫/学习任务/Task4.md)
# 机器学习 ### 初级算法梳理 * 内容设计: * 苏静、康兵兵、黑桃 * 学习目标 - 了解 机器学习的一些基本概念 - 理解 高等数学、线性代数、概率论与数理统计数学基础知识 - 掌握 线性回归 逻辑回归 决策树 聚类 贝叶斯 * 学习内容 - 线性回归 → 逻辑回归 → 决策树 → 聚类 → 贝叶斯原理 * 基本信息 * 定位人群:有概率论、矩阵运算、求导、泰勒展开等基础数学知识; * 时间安排:10天,2-3h/天 * 组队学习类型:理论学习 * 后续推荐组队学习:高级算法梳理 * 难度系数:中
任务安排 - Task1:[线性回归算法梳理(2天)](doc/机器学习/初级算法梳理/学习任务/Task1.md) - Task2:[逻辑回归算法梳理(2天)](doc/机器学习/初级算法梳理/学习任务/Task2.md) - Task3:[决策树算法梳理(2天)](doc/机器学习/初级算法梳理/学习任务/Task3.md) - Task4:[聚类算法梳理(2天)](doc/机器学习/初级算法梳理/学习任务/Task4.md) - Task5:[贝叶斯算法梳理(2天)](doc/机器学习/初级算法梳理/学习任务/Task5.md)
### 高级算法梳理 * 内容设计: * 黑桃,刘广月,于鸿飞 * 学习目标 - 掌握 随机森林 GBDT XGB LightGBM 的算法原理 * 学习内容 - RF → GBDT → XGB → LightGB * 基本信息 * 定位人群:有概率论、矩阵运算、求导、泰勒展开等基础数学知识; * 时间安排:10天,2-3h/天 * 组队学习类型:理论学习 * 先修组队学习:初级算法梳理 * 后续推荐组队学习:数据挖掘、数据竞赛(房租预测) * 难度系数:中
任务安排 - Task1:[随机森林算法梳理(2天)](doc/机器学习/高级算法梳理/学习任务/Task1.md) - Task2:[GBDT算法梳理(2天)](doc/机器学习/高级算法梳理/学习任务/Task2.md) - Task3:[XGB算法梳理(3天)](doc/机器学习/高级算法梳理/学习任务/Task3.md) - Task4:[LightGBM算法梳理(3天)](doc/机器学习/高级算法梳理/学习任务/Task4.md)
### 李宏毅机器学习(待完善) **[组队学习简介](doc/机器学习/李宏毅机器学习/README.md)**
任务安排 - Task1: - Task2: - Task3: - Task4: - Task5: - Task6: - Task7: - Task8: - Task9: - Task10:
### 西瓜书(待完善) **[组队学习简介](doc/机器学习/西瓜书/README.md)**
任务安排 - Task1: - Task2: - Task3: - Task4: - Task5: - Task6: - Task7: - Task8: - Task9: - Task10:
### 数据竞赛(房租预测) **[组队学习说明](doc/机器学习/数据竞赛(房租预测)/房租预测v2/课程说明.md)** * 内容设计: * 黑桃,四月,李威 * 学习目标 - 了解 比赛的全流程 - 掌握 数据清洗、特征工程、模型、模型融合等数据竞赛基本技能 * 学习内容 - 分析赛题 → 数据清洗 → 特征工程 → 模型选择 → 模型融合 → 比赛总结 * 基本信息 * 定位人群:熟练掌握Python基础、sklearn模块,了解基本机器学习算法,具备一定数据分析的能力; * 时间安排:15天,3-4h/天 * 组队学习类型:实践 * 先修组队学习:Python基础 * 难度系数:偏高
任务安排 - Task1:[赛题分析(2天)](doc/机器学习/数据竞赛(房租预测)/房租预测v2/学习任务/Task1.md) - Task2:[数据清洗(2天)](doc/机器学习/数据竞赛(房租预测)/房租预测v2/学习任务/Task2.md) - Task3:[特征工程(3天)](doc/机器学习/数据竞赛(房租预测)/房租预测v2/学习任务/Task3.md) - Task4:[模型选择(3天)](doc/机器学习/数据竞赛(房租预测)/房租预测v2/学习任务/Task4.md) - Task5:[模型融合(3天)](doc/机器学习/数据竞赛(房租预测)/房租预测v2/学习任务/Task5.md) - Task6:[比赛整理(2天)](doc/机器学习/数据竞赛(房租预测)/房租预测v2/学习任务/Task6.md)
### 大数据基础 * 内容设计: * sheldonwong、黑桃 * 学习目标 - 掌握 * 学习内容 - * 基本信息 * 定位人群:具有Linux基础/Shell/Python; * 时间安排:18天,4-5h/天 * 组队学习类型:实践 * 先修组队学习: * 后续推荐组队学习: * 难度系数:高
任务安排 - Task1:[创建虚拟机+熟悉(2天)](doc/机器学习/大数据基础/学习任务/Task1.md) - Task2:[搭建Hadoop集群(3天)](doc/机器学习/大数据基础/学习任务/Task2.md) - Task3:[HDFS初步(2天)](doc/机器学习/大数据基础/学习任务/Task3.md) - Task4:[MapReduce初步(3天)](doc/机器学习/大数据基础/学习任务/Task4.md) - Task5:[Hive初步(2天)](doc/机器学习/大数据基础/学习任务/Task5.md) - Task6:[Spark初步(3天)](doc/机器学习/大数据基础/学习任务/Task6.md) - Task6:[实践(3天)](doc/机器学习/大数据基础/学习任务/Task6.md)
# 深度学习 ### Pytorch基础 * 内容设计: * 许辉 李奇锋 * 学习目标 - 了解 deep learning常见操作的原理,含正则化、Dropout、优化器的公式 - 理解 Pytorch的本质是自动微分框架 - 掌握 解决问题的基本pipeline,含数据预处理、神经网络搭建、简单的调参 * 学习内容 - 安装Pytorch → 设立图并计算 → 实现逻辑回归 → 构建多层神经网络 → PyTorch实现L1,L2正则化以及Dropout → 书写优化器代码 → 用PyTorch完成手写数字识别 * 基本信息 * 定位人群:刚接触Pytorch的使用但了解Python基本语法; * 时间安排:14天,2-3h/天 * 组队学习类型:实践 * 先修组队学习:无 * 后续推荐组队学习:(暂无,maybe以后可以[按此](https://github.com/dlsys-course)扩展课程,进一步理解pytorch系统框架,偏软件工程) * 难度系数:中
任务安排 - Task1:[PyTorch的基本概念(2天)](doc/深度学习/Pytorch/学习任务/Task1.md) - Task2:[设立计算图并自动计算(2天)](doc/深度学习/Pytorch/学习任务/Task2.md) - Task3:[PyTorch实现Logistic regression(2天)](doc/深度学习/Pytorch/学习任务/Task3.md) - Task4:[PyTorch实现多层网络(2天)](doc/深度学习/Pytorch/学习任务/Task4.md) - Task5:[PyTorch实现L1,L2正则化以及Dropout(2天)](doc/深度学习/Pytorch/学习任务/Task5.md) - Task6:[PyTorch理解更多神经网络优化方法(2天)](doc/深度学习/Pytorch/学习任务/Task6.md) - Task7:[手写数字识别(2天)](doc/深度学习/Pytorch/学习任务/Task7.md)
### Keras * 内容设计: * 有容 * 学习目标 - 掌握 * 学习内容 - * 基本信息 * 定位人群: * 时间安排:9天,2-3h/天 * 组队学习类型:实践 * 先修组队学习:无 * 后续推荐组队学习: * 难度系数:中
任务安排 - Task1:[快速了解keras(2天)](doc/深度学习/Keras/学习任务/Task1.md) - Task2:[keras的网络层(2天)](doc/深度学习/Keras/学习任务/Task2.md) - Task3:[数据预处理(2天)](doc/深度学习/Keras/学习任务/Task3.md) - Task4:[keras其他功能(3天)](doc/深度学习/Keras/学习任务/Task4.md)
### 深度学习(理论) **[组队学习简介](doc/深度学习/深度学习(理论)/README.md)**
任务安排 - Task1:[感知机(2天)](doc/深度学习/深度学习(理论)/学习任务/Task1.md) - Task2:[神经网络(3天)](doc/深度学习/深度学习(理论)/学习任务/Task2.md) - Task3:[深度神经网络DNN(3天)](doc/深度学习/深度学习(理论)/学习任务/Task3.md) - Task4:[CNN(2天)](doc/深度学习/深度学习(理论)/学习任务/Task4.md) - Task5:[CNN的发展上的几种常见算法、网络结构以及它们的优缺点(3天)](doc/深度学习/深度学习(理论)/学习任务/Task5.md) - Task6:[CNN算法的应用(3天)](doc/深度学习/深度学习(理论)/学习任务/Task6.md) - Task7:[RNN(3天)](doc/深度学习/深度学习(理论)/学习任务/Task7.md) - Task8:[GRU及LSTM(3天)](doc/深度学习/深度学习(理论)/学习任务/Task8.md)
# 理论应用 ### 数据挖据 * 内容设计: * 范晶晶、李碧涵 * 学习目标 - 知道 数据挖掘项目的完整流程 - 了解 基本的数据预处理操作 - 理解 各机器学习模型的调参优化 - 掌握 数据预处理、特征工程、模型构建、模型调参和模型融合等数据竞赛基本技能 * 学习内容 - 数据分析 → 特征工程 → 模型构建 → 模型评估 → 模型调优 → 模型融合 * 基本信息 * 定位人群:有Python基础,sklearn基础; * 时间安排:12天,2-3h/天 * 组队学习类型:实践 * 先修组队学习: * 后续推荐组队学习:数据竞赛(房价预测) * 难度系数:中
任务安排 - Task1:[数据分析(2天)](doc/理论应用/数据挖掘/学习任务/Task1.md) - Task2:[特征工程(2天)](doc/理论应用/数据挖掘/学习任务/Task2.md) - Task3:[模型构建 (2天)](doc/理论应用/数据挖掘/学习任务/Task3.md) - Task4:[模型评估(2天)](doc/理论应用/数据挖掘/学习任务/Task4.md) - Task5:[模型调优(2天)](doc/理论应用/数据挖掘/学习任务/Task5.md) - Task6:[模型融合(2天)](doc/理论应用/数据挖掘/学习任务/Task6.md)
### 自然语言处理(基础篇) * 内容设计: * jepson 莲说 * 学习目标 - 知道 文本的数据预处理操作,文本表示 - 了解 如何在文本表示的前提下,简单应用机器学习算法 - 理解 LDA主题模型算法的原理以及应用 - 掌握 机器学习算法在NLP方面的应用 * 学习内容 - 特征提取→特征选择→文本表示→传统机器学习算法跑模型→LDA生成新特征 * 基本信息 * 定位人群:有Python基础,基本框架的基础(例如TensorFlow、Keras和pyTorch等); * 时间安排:8天,3-4h/天 * 组队学习类型:实践 * 先修组队学习:初级算法梳理 高级算法梳理 * 后续推荐组队学习:自然语言处理(进阶篇) * 难度系数:高
任务安排 * 预备任务:[tensorflow安装+tensrflow基础+NLP](doc/理论应用/自然语言处理(基础篇)/学习任务/预备任务.md) * Task1:[数据集探索(2天)](doc/理论应用/自然语言处理(基础篇)/学习任务/Task1.md) * Task2:[特征提取(2天)](doc/理论应用/自然语言处理(基础篇)/学习任务/Task2.md) * Task3:[特征选择(2天)](doc/理论应用/自然语言处理(基础篇)/学习任务/Task3.md) * Task4:[传统机器学习+讨论(2天)](doc/理论应用/自然语言处理(基础篇)/学习任务/Task4.md)
### 自然语言处理(进阶篇) * 内容设计: * jepson 莲说 * 学习目标 - 知道 词向量的原理 - 了解 基本的卷积神经、循环神经网络在NLP方面的应用 - 理解 Attention原理在NLP方面的应用 - 掌握 基本深度神经网络在NLP方面的应用 * 学习内容 - 数据集探索 → 神经网络基础 → 简单神经网络 → 卷积神经网络 → 循环神经网络 → Attention原理 → Bert原理 * 基本信息 * 定位人群:学完自然语言处理入门组队学习的同学或有自然语言处理基础的巨佬; * 时间安排:14天,3-4h/天 * 组队学习类型:实践 * 先修组队学习:初级算法梳理 高级算法梳理 自然语言处理(进阶篇) * 后续推荐组队学习: * 难度系数:高
任务安排 * Task1:[数据集探索(2天)](doc/理论应用/自然语言处理(进阶篇)/学习任务/Task1.md) * Task2:[神经网络基础(2天)](doc/理论应用/自然语言处理(进阶篇)/学习任务/Task2.md) * Task3:[简单神经网络+讨论(2天)](doc/理论应用/自然语言处理(进阶篇)/学习任务/Task3.md) * Task4:[卷积神经网络(2天)](doc/理论应用/自然语言处理(进阶篇)/学习任务/Task4.md) * Task5:[循环神经网络(2天)](doc/理论应用/自然语言处理(进阶篇)/学习任务/Task5.md) * Task6:[Attention原理+讨论(2天)](doc/理论应用/自然语言处理(进阶篇)/学习任务/Task6.md) * Task7:[Bert+讨论(2天)](doc/理论应用/自然语言处理(进阶篇)/学习任务/Task7.md)
### Spark基础 * 内容设计: * Summer * 学习目标 - 知道 spark和hive的区别、spark的发展 - 了解 spark运行原理、RDD编程设计 - 理解 Spark streaming - 熟悉 DataFrame、SPARKSQL操作和Mlib的使用 * 学习内容 - 运行原理 & 环境搭建 → 熟悉RDD & RDD编程 → SparkSQL → MLlib → 常用算法 * 基本信息 * 定位人群:掌握Python基础;难度系数中 * 时间安排:12天,3-4h/天 * 组队学习类型:理论+实践、刷视频 * 先修组队学习:Python基础 * 后续推荐组队学习:大数据 * 难度系数:高
任务安排 - Task1:[运行原理、RDD设计、DAG、安装与使用(3天)](doc/机器学习/Spark基础/学习任务/Task1.md) - Task2:[RDD编程、熟悉算子、读写文件(3天)](doc/机器学习/Spark基础/学习任务/Task2.md) - Task3:[DataFrame、SparkSQL (2天)](doc/机器学习/Spark基础/学习任务/Task3.md) - Task4:[MLlib流设计、特征工程 (2天)](doc/机器学习/Spark基础/学习任务/Task4.md) - Task5:[逻辑回归、决策树(2天)](doc/机器学习/Spark基础/学习任务/Task5.md)
### 图像处理基础 * 内容设计: * 张峰 * 学习目标 - 掌握 opencv在图像处理方面的基础操作 * 学习内容 - * 基本信息 * 定位人群:了解python基础操作和numpy基本操作; * 时间安排:17天,2-3h/天 * 组队学习类型:理论+实践 * 先修组队学习:python基础 * 后续推荐组队学习: * 难度系数:中
任务安排 - Task1:[初识opencv(2天)](doc/机器学习/图像处理基础/学习任务/Task1.md) - Task2:[灰度变换和二值化(3天)](doc/机器学习/图像处理基础/学习任务/Task2.md) - Task3:[滤波操作(4天)](doc/机器学习/图像处理基础/学习任务/Task3.md) - Task4:[形态学处理 (4天)](doc/机器学习/图像处理基础/学习任务/Task4.md) - Task5:[图像分割1(2天)](doc/机器学习/图像处理基础/学习任务/Task5.md) - Task6:[图像分割2(2天)](doc/机器学习/图像处理基础/学习任务/Task6.md)
### 论文复现 **[组队学习简介](doc/基础知识/NLP论文复现/README.md)** # Copyright 版权声明:Datawhale_Learning组队学习内容仅用于学习、研究和交流。版权归Datawhale、文章作者和组队学习 内容设计者所有,严禁用于商业用途,违者必究。