🔥 Apache DolphinScheduler是一个新一代分布式大数据工作流任务调度系统,致力于“解决大数据任务之间错综复杂的依赖关系,整个数据处理开箱即用”。它以 DAG(有向无环图) 的方式将任务连接起来,可实时监控任务的运行状态,同时支持重试、从指定节点恢复失败、暂停及 Kill任务等操作。目前已经有像IBM、腾讯、美团、360等400多家公司生产上使用,下载安装包请去官网
🔥 Apache DolphinScheduler是一个新一代分布式大数据工作流任务调度系统,致力于“解决大数据任务之间错综复杂的依赖关系,整个数据处理开箱即用”。它以 DAG(有向无环图) 的方式将任务连接起来,可实时监控任务的运行状态,同时支持重试、从指定节点恢复失败、暂停及 Kill任务等操作。目前已经有像IBM、腾讯、美团、360等400多家公司生产上使用,下载安装包请去官网
如果你在从事大数据BI的工作,想对比一下MySQL、GreenPlum、Elasticsearch、Hive、Spark SQL、Presto、Impala、Drill、HAWQ、Druid、Pinot、Kylin、ClickHouse、Kudu等不同实现方案之间的表现,那你就需要一份标准的数据进行测试,这个开源项目就是为了生成这样的标准数据。本站是data-generator在Github的镜像站点,仅做备份使用。 https://github.com/ysc/data-generator
此项目是自己在学习Hadoop知识练习的一些小案例的汇总。 主要涉及HDFS的JAVA API操作和MapReduce重要知识点的小练习,包括利用HDFS JAVA API实现读取HDFS中文件、写入数据到HDFS中、删除HDFS中数据、查询HSFS中文件元数据、列出HDFS中文件详细信息等相关的操作,MapReduce程序实现的汇总、求平均数、Jion操作、TopK算法、二次排序、以及自定义InputFormat、OutputFormat和shuflle阶段的一些应用如(自定义Partitioner、合并小文件、MutilpleOutPuts自定义输出等等)。 每个案例都以不同的包区分。 详细说明见Readme.md文件
Python Kerberos 管理员模块,通过python管理Kerberos KDC账号,支持账号添加,删除,修改以及导出keytab文件,原作 https://github.com/rjancewicz/python-kadmin
MUI-Module User Interface,which is built by module and could be loaded on need。
Contributions last year: 1
Max continuous contributions: 1
Recent contributions: 1
Commits, issues, and pull requests will appear on your contribution graph. Only when the email address used for the commits in local configuration is associated with your GitOSC account, the commits' contribution will be counted.