|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
C#是不行的,比如说美国的航天飞船里就有java开发的程序以上是我的愚见,其实不管那种语言,你学好了,都能找到好的工作,DataX是一款撑持恣意异构数据体系离线数据互换的工具、框架、平台,完成了在恣意的数据处置体系(RDBMS/Hdfs/Localfilesystem)之间的数据互换。今朝DataX撑持数十种各种数据存储、盘算体系,天天为阿里团体传输数据高达数十T。DataX服务的客户不单单范围于三淘、付出宝、阿里巴巴B2B,阿里团体内部客户有公共点评、蘑菇街等也在接纳DataX建立海量数据同步中央。将来DataX将完成阿里团体数据同步总线,完成阿里团体数据无拦阻的活动。新版DataX2.0(散布式版本)外部已上线,估计往年正式提交开源社区。
DataX办理的成绩
完成跨平台的、跨数据库、分歧体系之间的数据同步及交互。
假如我们具有良多分歧范例的数据库/文件体系(Mysql/Oracle/Rac/Hive/Other…),而且常常必要在它们之间导进导出数据,那末我们大概必要开辟/保护/进修利用一批如许的工具(jdbcdump/dbloader/multithread/getmerge+sqlloader/mysqldumper…)。并且今后每增添一种库范例,我们必要的工具数量将线性增加。(当我们必要将mysql的数据导进oracle的时分,有无过想从jdbcdump和dbloader上各掰上去一半拼在一同到感动?)这些工具有些利用文件直达数据,有些利用管道,分歧水平的为数据直达带来分外开支,效力不同很十分年夜。良多工具也没法满意ETL义务中罕见的需求,好比日期格局转化,特征字符的转化,编码转换。别的,有些时分,我们但愿在一个很短的工夫窗口内,将一份数据从一个数据库同时导出到多个分歧范例的数据库。DataX恰是为懂得决这些成绩而生。
以往,增添一范例的数据对接,我们大概为此增添一个接口大概是特地开辟兼容数据的体系,以下图:
倘使我们必要增添一个数据源和方针源,那我们不能不从头开辟一套新的同步工具
阿里的DataX一致了这标准并供应复杂的数据源接口便利用户自界说必要的同步工具,以下图
DataX布局形式(框架+插件)
用winrar打包j2ee的程序和用IDE打包应用程序是一样的。按照你的想法,你是不是也希望服务器都整合由一家公司提供呢? |
|