大數據架構師工作職責
明確的職責可以減少工作扯皮現象的發生,因為每個員工都清楚自己的職責范圍和工作任務。大數據架構師工作職責要怎么寫?接下來給大家帶來大數據架構師工作職責,方便大家學習。
大數據架構師工作職責篇1
職責:
1、負責公司的大數據處理框架的研發設計工作,梳理可實現方案和技術規范;
2、開發、完善公司大數據平臺;參與公司離線、實時大數據處理系統的設計、開發、測試及多個業務模塊的自動化集成;
3、負責業務平臺數據統計分析模塊的設計與規劃;
4、負責公司產品研發過程中的數據及存儲設計;
5、帶領和培養團隊完成組織分解的目標;
任職要求:
1、統招本科及以上學歷,計算機、軟件工程相關專業,至少8年以上工作經驗,5年以上大數據開發經驗;
2、熟悉Java、Hadoop、HDFS、Hive、HBase、Spark、Storm、Flume等相關技術的基礎架構
3、熟悉數據倉庫,數據算法,分布式計算技術理論,具有大數據整體系統架構設計經驗;
4、熟悉Linux系統,熟練使用shell/perl/python腳本處理問題;
5、對深度學習框架(Tensorflow)和機器學習(svm隨機深林貝葉斯等)有一定了解的優先;
6、能夠組織項目開發組協同工作,包括團隊溝通、計劃、開發環境管理等
大數據架構師工作職責篇2
職責:
1、負責大數據平臺的架構設計、核心代碼開發等任務;根據項目要求編寫相關技術文檔;
2、負責大數據平臺的架構評審,代碼評審,上線評審;參與數據應用需求、設計、審核和評審;
3、負責核心模塊研發,負責大數據平臺的搭建,完成系統調試、集成與實施;
4、負責建立和維護大數據平臺技術標準規范,指導開發人員編寫代碼;
任職要求:
1、本科及以上計算機相關專業畢業;
2、精通離線和實時數據處理流程,掌握離線數據處理框架hive、impala、spark-sql等,掌握實時數據處理常用技術工具,包括Storm、SparkStreaming等;
3、熟悉大數據技術生態圈,精通大數據技術架構,有大數據平臺構建經驗;
4、掌握常見數據流接入工具,包括Flume、kafka等;
5、熟練掌握基本的Linux操作系統和某種腳本語言編程(如Shell等);
6、掌握一種或以上實時處理語言,如JAVA、SCALA、PYTHON等,有SCALA經驗者優先;
7、有實際大規模數據(TB級以上)處理經驗優先;
大數據架構師工作職責篇3
職責:
1.負責整個大數據平臺架構的設計和構建;
2.負責構建大數據平臺的數據交換、任務調度等通用平臺;
3.制定開發、測試、實施、維護的標準和規范,指導和培訓工程師,不斷提升團隊能力。
4.參與系統需求分析、架構設計、技術選型、應用設計與開發以及測試與部署,負責編寫核心部分代碼。
5.持續挑戰新的技術方向,攻克大數據量、高并發、高可用、可擴展等技術難點。
任職要求:
1.3年以上大數據架構經驗,豐富的數據倉庫、數據挖掘、機器學習項目經驗
2.大規模數據處理的架構和設計實戰經驗
3.精通Spark、MR,熟練HDFS、Yarn、Hbase、Hive、MongoDB,熟悉Kafka、Redis、Storm、Mahout、Flume、ElasticSearch、GraphDB(NEO4J或其他)等,并具有豐富的大型數據平臺工程經驗
4.深刻理解大數據處理(流計算,分布式計算,分布式文件系統,分布式存儲等)相關技術和實現方法
5.熟悉主數據、元數據、數據質量等企業數據管理相關的體系和方法,熟練Linux/Unix平臺上的開發環境
6.本科或以上學歷,計算機軟件或相關專業,豐富的java開發經驗和互聯網背景優先。
7.具有比較強的問題分析和處理能力,有比較優秀的動手能力,熱衷技術,精益求精
大數據架構師工作職責篇4
職責:
1.負責產品級業務系統架構(如業務數據對象識別,數據實體、數據屬性分析,數據標準、端到端數據流等)的設計與優化。協助推動跨領域重大數據問題的分析、定位、解決方案設計,從架構設計上保障系統高性能、高可用性、高安全性、高時效性、分布式擴展性,并對系統質量負責。
2.負責云數據平臺的架構設計和數據處理體系的優化,推動云數據平臺建設和持續升級,并制定云數據平臺調用約束和規范。
3.結合行業應用的需求負責數據流各環節上的方案選型,主導云數據平臺建設,參與核心代碼編寫、審查;數據的統計邏輯回歸算法、實時交互分析;數據可視化方案等等的選型、部署、集成融合等等。
4.對云數據平臺的關注業內技術動態,持續推動平臺技術架構升級,以滿足公司不同階段的數據需求。
任職要求:
1.熟悉云計算基礎平臺,包括Linux(Ubuntu/CentOS)和KVM、OpenStack/K8S等基礎環境,熟悉控制、計算、存儲和網絡;
2.掌握大型分布式系統的技術棧,如:CDN、負載均衡、服務化/異步化、分布式緩存、NoSQL、數據庫垂直及水平擴容;熟悉大數據應用端到端的相關高性能產品。
3.精通Java,Python,Shell編程語言,精通SQL、NoSQL等數據庫增刪改查的操作優化;
4.PB級別實戰數據平臺和生產環境的實施、開發和管理經驗;
5.熟悉Docker等容器的編排封裝,熟悉微服務的開發和日常調度;
6.計算機、軟件、電子信息及通信等相關專業本科以上學歷,5年以上軟件工程開發經驗,2年以上大數據架構師工作經驗。
大數據架構師工作職責篇5
職責:
1、負責大數據倉庫、數據集市的規劃及實現,負責大數據中臺的設計和核心開發工作;
2、負責數據基礎架構和數據處理體系的升級和優化,不斷提升系統的穩定性和效率,為公司的業務提供大數據底層平臺的支持和保證;
3、大數據平臺的數據采集、處理、存儲以及挖掘分析的架構實現;
4、研究未來數據模型和計算框架的創新與落地,包括但不限于以下領域:大規模數據實時化、研發模式敏捷化、數據計算框架輕量化、數據模型組織方式業務化等方面,參與制定并實踐團隊的技術發展路線
任職資格:
1、精通數據建模、數據標準管理、元數據管理、數據質量管理;
2、有作為技術負責人系統化解決問題的成功案例;有海量數據實踐經驗優先;
3、熟悉目前正在發展的大數據分布式平臺前沿技術的應用;包括但不僅僅限于:hadoop、flink、spark等;
4、性格積極樂觀,誠信,能自我驅動,有較強的語言表達能力;具備強烈的進取心、求知欲及團隊合作精神;具有良好的溝通、團隊協作、計劃和創新的能力;在數據業界有一定的影響力優先,具有風控經驗背景的人優先;
5、具備獨立的深度思考能力,給出結合實際情況的較為理想的技術解決方案。
大數據架構師工作職責篇6
職責:
1、負責規劃科技大數據平臺及科技數據入庫自動化的方案設計;
2、負責大數據平臺的開發和維護,以及對外服務接口的開發;
3、負責大數據平臺的優化和改進工作。
任職要求
1、計算機相關專業本科及以上學歷,5年以上開發經驗,其中3年以上為互聯網、大數據相關的開發經驗;
2、熟知Hadoop生態圈體系,精通Hadoop/Spark/Storm/Kafka中的一項或幾項,深刻理解MapReduce的運行原理和機制,有MPI經驗者尚佳;
3、熟悉Elasticsearch、Redis、Hbased等相關數據庫的構建和操作,尤其是數據庫集群的構建和操作,熟悉Neo4j者尚佳;
4、具有機器學習相關項目經驗者優先。
大數據架構師工作職責篇7
職責:
1、數據分析軟件平臺架構搭建
2、負責深度學習核心框架或高性能后臺服務系統的架構設計工作,包括系統總體規劃、架構設計、系統分析、軟件實現、性能優化;
3、指導開發人員開發,并解決系統出現的問題,理解物業需求;
4、制定開發計劃和控制開發進度,負責指導研發團隊開展設計工作;
任職要求:
1、碩士以上,計算機或先關專業;
2、5年左右軟件開發經驗,含3年以上系統分析、設計經驗,有大型軟件項目大型軟件項目;有中大型互聯網企業數據庫架構設計及管理經驗,
3、具備良好的組件級建模能力,熟悉HTTP、TCP等協議
4、熟練使用UML進行軟件架構設計,至少精通EA,RATIONAL,VISIO等一種設計工具.
5、精通至少一種編程語言,熟悉Linux相關技術,能獨立在上面進行開發、測試和部署
6、深入理解數據庫、數據倉庫、大數據、分布式體系架構和關鍵技術
大數據架構師工作職責篇8
職責:
1.能夠帶領技術人員基于hadoop平臺進行海量數據應用系統開發;
2.負責結構化和非結構化數據的解析和清洗,海量數據查詢和報表展現;
3.負責超大規模數據平臺的搭建、維護和優化;
4.負責大數據采集、存儲框架研究,參與在線或離線數據存儲模型設計;
5.負責大數據平臺新技術的開發使用和性能優化,測試。
任職資格:
1.計算機相關專業本科及以上學歷;
2.熟悉hadoop相關各種開源項目,比如HDFS/Hive/Hbase等有實際應用。(5年以上開發經驗者優先);
3.兩年以上熟練編寫mapreduce代碼經驗,有三年以上網絡日志分析、ETL經驗。熟悉日志分析框架chukwa,flume,scribe者優先;
4.兩年以上海量數據存儲的安裝部署、優化、二次開發經驗,對大規模數據存儲、傳輸、處理等有豐富的經驗;
5.在數據挖掘、數據密集型處理、分布式計算、網格計算領域有深入理論基礎;
6.具有較強的文檔撰寫能力,較強的團隊精神和合作精神,對工作有熱情,能承受壓力。
大數據架構師工作職責篇9
1、負責大數據平臺資源規劃、權限控制、運維架構設計,為各產品業務提供穩定、高效、安全的運行環境;
2、負責實時,離線數據分析處理及實時平臺的建設和搭建
3、熟悉Flink流式計算引擎的使用以及源碼原理,并且有相關的流式處理平臺的經驗。
4、Java基礎扎實,熟練掌握垃圾回收,網絡,多線程編程,了解python或scala
5、負責大數據平臺技術架構、數據架構的分析與設計;
大數據架構師工作職責篇10
職責:
1、正確理解業務需求,對需求進行工作量評估;
2、參與項目相關的需求、設計、投產手冊等文檔的編寫;
3、根據進度計劃,完成所承擔功能模塊的設計、開發、單元測試、聯調測試;
4、配合測試組修復代碼缺陷,確保功能實現與代碼質量;
5、負責所承擔功能模塊投產、部署,及上線后的日常維護;
6、完成項目經理或者架構師安排的其他工作;
任職資格:
1、本科以上學歷,計算機相關專業,兩年以上大數據開發經驗;
2、熟悉Linux環境,掌握shell或python;
3、熟練使用hadoop,hive,HBase,YARN,kafka,spark等大數據開發組件;
4、精通ETL,數據倉庫的設計和開發;
5、有大數據處理實戰經驗,熟悉整個大數據的完整處理流程,包括數據的采集、清洗、存儲;
6、較強的動手能力和學習能力,良好的溝通能力、團隊協調能力;
7、具有銀行、金融行業從業背景者優先。
大數據架構師工作職責篇11
職責:
1.負責公司大數據底層框架的整體架構設計,結合公司實際業務情況進行技術選型及大數據戰略規劃;
2.負責統一數據平臺項目的整體評估、設計、架構及關鍵模塊的開發,不斷提升系統的穩定性和效率;
3.負責架構優化及系統關鍵模塊的設計開發,協助團隊解決開發過程中的技術難題;
4.建立良好的公司內外的業界技術影響力;有效輔導團隊,提升數據研發能力;
任職要求:
1.從事大數據項目相關開發和設計2年以上經驗;有作為技術負責人系統化解決問題的成功案例;有海量數據實踐經驗優先;
2.擁有一定的算法和數據結構基礎;有很強的數據設計抽象能力,善于從復雜的數據問題中找到關鍵路徑;
3.熟悉目前正在發展的大數據分布式平臺前沿技術的應用;包括但不僅僅限于:hadoop、storm、spark、等;
4.良好的邏輯思維能力,良好的業務解讀能力,懂電力或通信業務優先;
5.具有鉆研精神,樂于接受挑戰;
大數據架構師工作職責篇12
職責:
1、負責自然語音交互、IOT家電物聯控制、知識圖譜等相關模塊和系統的開發;
2、負責掌握第三方接口的調用和功能實現,持續優化服務性能和容量,并保證產品的兼容性和執行效率;
3、根據設計文檔和需求說明完成代碼編寫、調試、單元測試與維護,確保項目進度和質量;
4、協助制定測試計劃,及時發現并修復BUG,實現服務端的性能優化。
任職資格:
1、大學本科3年以上工作經驗,計算機相關專業;
2、熟悉軟件項目開發流程,具有良好編碼風格及文檔編寫能力;
3、熟悉Linux服務器相關技術,能夠獨立完成服務器部署,具有相關經驗;
4、熟悉Hadoop/Spark框架,JAVA基礎扎實;
5、熟練使用Mysql數據庫,了解MongoDB或neo4j等分布式數據庫;
6、熟悉SpringCloud,SSM,Docker,redis開發者優先;
7、熟悉前端(包括但不限于Html5、css、Angularjs、ajax、jquery等)開發技術優先;
8、了解Socket網絡編程、MQTT等,有相應實踐經驗者優先;
9、有智能語音語義、知識圖譜服務端開發經驗者優先。
大數據架構師工作職責篇13
職責:
1.負責數據倉庫建設,基于數據驅動構建企業級數據模型,根據架構設計進行各層數據模型開發。
2.面向PB級別超大規模數據處理和查詢需求,設計適合業務變化的合理的多維數據分析系統架構,滿足多樣性需求。
3.構建設計良好的數據流、調度系統、查詢引擎、監控系統,保證系統穩定高效運行,以實現數據的最大價值。
4.指導團隊成員開展數據倉庫建設。
5.參與重點項目的評審,參與企業數據管理體系建設。
任職要求:
1.統招本科及以上學歷。
2.從事數據倉庫領域至少5年以上,熟悉數據倉庫模型設計與ETL開發經驗,掌握Kimball的維度建模設計方法,具備海量數據加工處理(ETL)相關經驗。
3.具有一定數據模型和數據架構基礎,熟悉hadoop\hive和常用數據庫。
4.精通SQL,有一定的SQL性能調優經驗,熟悉hivesql的開發。
5.具有管理團隊開發經驗,具備良好的組織能力、協調能力及項目管理能力。
6.具有較好的文字功底及語言表達能力,能夠快速、準確地理解需求。
7.具有專研、快速學習和創新精神,具備獨立分析問題和解決問題的能力。
8.具有責任心,時間觀念強,工作獨立性強,有良好的團隊合作精神。
9.全日制普通本科畢業。
大數據架構師工作職責篇14
職責:
(1)負責公司大數據平臺搭建,相關的設計和技術開發工作,負責大數據存儲系統、分布式計算系統、數據集成、挖掘算法等的設計、研發以及維護、優化工作;
(2)通過數據分析技術,挖掘有利于營銷中各業務場景的變量或規則類標簽,以提升模型效果,為文旅、教育業務提供數學模型理論及編程支撐;
(3)對接溝通業務系統研發團隊和產品部門,提供數據驅動方面的專業咨詢方案,并對業務的大數據應用場景提出建設性意見;
(4)配合部門領導進行項目需求分析、設計開發工作。
任職要求:
(1)計算機、統計學,數學等相關專業本科以上學歷,5年以上大數據或文旅、教育數據產品設計開發經驗,高效高質量產出需求和技術文檔;
(2)精通Hadoop,熟悉大數據生態技術,如Storm、Spark、Scala、Flume、Kafka、Zookeeper、Hive、Hbase、Kerberos等,有大規模集群架構、開發及運維經驗;熟悉HDFS/MapReduce等;
(3)熟悉Java,能夠獨立應用python、R、SAS或類似分析工具進行數據分析;
(4)熟悉大數據挖掘、可視化分析,各種BI算法和產品等,在計算廣告、搜索引擎、推薦系統、用戶畫像等有一個或多個算法領域的研發經驗,能夠運用數據作為產品解決業務方運營及決策問題;
(5)有互聯網行業工作經驗者優先,有海量數據的機器學習算法實踐經驗優先;
(6)工作認真、負責,有良好的團隊合作精神,良好的分析能力、溝通技巧。
大數據架構師工作職責篇15
職責:
1.負責企業數據中心建設,設計數據邏輯模型和物理模型,并完成相關開發
2.梳理公司各業務線常用的指標和維度,統一指標定義口徑
3.根據數據應用開發和數據分析需求,設計數據倉庫信息層模型,提高數據開發的效率
4.負責數據模型的運營和優化,及時響應業務邏輯變更,保證模型的數據質量和穩定性
5.負責公司數據標簽體系的建設,并推動標簽體系在實際業務場景中落地
崗位要求:
1.5年以上DW/BI數據架構設計、模型設計和性能調優等相關經驗
2.有較強的數據分析能力,精通數據倉庫架構,熟悉Erwin或PowerDesigner建模工具
3.精通一種主流關系數據庫(如mysql等),熟悉Hive開發
4.有電商業務經驗,元數據管理,數據質量管理或標簽體系搭建經驗者優先
5.優秀的協調溝通與團隊協作能力,極強的責任心,能承受一定的工作壓力,認同企業文化和團隊價值
大數據架構師工作職責篇16
1.負責數瀾大數據平臺的架構設計和研發,建立數據生態服務,解決海量數據面臨的挑戰;
2.管理和優化Hadoop、Spark等集群,計算作業的調優,保證集群和平臺的高效和穩定;
3.負責Hadoop、Spark、Flink的功能、性能和擴展,解決并實現業務需求;
4.負責大數據產品的自動化、離線與實時計算、即席計算、數據質量、數據安全、機器學習等平臺的設計和開發;
5.調研和把握當前的最新技術,將其中的先進技術引入到自己的平臺中,改善產品,提升競爭力;
大數據架構師工作職責篇17
職責:
1、負責規劃大數據平臺及應用產品的需求和技術方案設計;
2、負責數據對接和對外服務設計、開發和維護,并能保證質量和性能;
3、負責基于大數據平臺的應用設計、開發和維護;
4、能從系統全局和各子系統的角度思考可能存在的問題,并提出改進方案建議;
任職要求:
1、大學本科6年以上工作經驗,計算機相關專業。
2、至少4年以上的Java開發經驗,3年以上大數據應用系統的開發和設計經驗。
3、熟悉Hadoop生態圈技術體系,對離線計算、內存計算和流式計算均有深刻理解,如Hadoop、Storm、Spark三個中的任意二個,能進行平臺和組件優化。
4、精通Hive、HBase倉庫設計,深刻理解MR運行原理和機制,能進行以提供高任務執行效率的優化。
5、精通Java開發,熟悉JVM調優,對GC有深刻理解。
6、熟悉Linux、Shell、Kafka、Oracle、Mysql、Redis等相關技術,能進行hbase可靠性診斷和維護。
7、快速研究和學習技術能力。
大數據架構師工作職責篇18
職責:
1、負責大數據平臺架構的評估、規劃和設計;負責海量數據采集、處理及存儲、應用方案的技術選型及架構實現;
2、開發大數據平臺的核心代碼,負責大數據平臺的搭建,完成系統調試、集成與實施,技術難題的解決,保證大數據產品的上線運行;
3、根據業務需求持續優化數據架構,保證產品的可靠性、穩定性;
4、指導開發人員完成數據模型規劃建設,分析模型構建及分析呈現,分享技術經驗;
5、負責大數據平臺的架構評審,代碼評審,上線評審;參與數據應用需求、設計、審核和評審;
6、深入研究大數據相關技術和產品,跟進業界先進技術;
任職資格:
1.本科及以上學歷,數學或計算機相關專業畢業,不少于5年的工作經驗,具有扎實的計算機基礎理論知識;
2.有3年以上Hadoop、Spark、Hbase平臺性能調優經驗;熟悉sparkstreaming等實時計算技術
3.熟悉hive、hbase、storm、mahout、flume、ElasticSearch、Spark、Kafka等,具備實際項目設計及開發經驗;
4.熟悉sparkstreaming等相關的實時計算技術;
5.熟悉大規模數據挖掘、機器學習、自然語言處理、分布式計算中一項或多項技術,并具備多年的實際工作經驗;
6.熟悉主流關系型數據庫(Oracle、MySql)、NoSql數據庫,熟悉pl/sql編程;精通Linux操作系統,熟練使用Java;熟悉常用框架.如Spring、MyBatis等;
7.具有較強的執行力,高度的責任感、很強的學習、溝通能力,能夠在高壓下高效工作;
大數據架構師工作職責篇19
職責:
1、負責spark,hadoop,flink等開發和優化。
2、參與前期需求溝通和分析,以產品化開發的思維,完成需求分解和數據架構設計。
3、與研發和數據科學家合作保證產品定義清晰,按時完成產品上線。
4、能夠洞察市場狀況,與各部門合作轉化為基于大數據挖掘的新策略或方案.
5、主動創造和發掘新的基于大數據挖掘產品商業模式.
任職要求:
1、全日制本科及以上學歷,計算機軟件相關專業,5年以上開發經驗,3年以上架構經驗
2、精通hadoop/MapReduce/Spark/Hbase/Flink/Hive/R/Mahout等分布式數據存儲和分布式計算平臺原理,流式計算開發,有開源二次開發經驗者優先。
3、精通大數據挖掘、機器學習.熟練掌握Java/Perl/Python至少一種編程語言。
4、具有數據挖掘和分析、機器學習等項目實施相關經驗者優先;
5、良好的跨部門溝通合作能力,解決不同觀點能力并取得結果。具備敏銳的互聯網產品理解力,學習能力和邏輯思維能力強;
6、較強的自我驅動力、推動和協調能力,強烈的責任心和團隊合作精神;
大數據架構師工作職責篇20
職責:
1、從事電信行業大數據項目相關業務調研、產品標準建設、核心模型設計和優化、系統測試等相關工作
2、與數據專業委員會一起研究數據建模方案和建模工具,負責產品線產品的數據架構、數據模型設計
3、參與研究數據庫之間的數據轉換方式,參與項目中的數據移植工作,收集在項目中的數據移植經驗,優化產品的數據模型
4、負責培訓本部門隊伍的數據模型基礎理論工作,建立數據模型團隊
崗位要求:
1、統招本科學歷,3年以上主流數據上(DB2、Oracle、SQLServer、Mysql等)ETL設計、開發經驗,具備大型數據倉庫邏輯模型和物理模型設計經驗,精通SQL,有較好的SQL性能調優經驗;
2、擁有Python,R等數學建模工具的使用經驗,并具備一定的數據處理和建模經驗,可以輸出相應的模型分析結果、模型比較、模型效率以及對模型的理論和判斷依據方法并對其進行完整的解釋和說明;
3、熟悉統計學基本原理,做過實戰的數據建模項目;
4、有分布式數據倉庫建設相關經驗者優先,具備電信行業數據倉庫建設相關經驗者優先;