Spark结构式流编程指南

发布时间：2017年03月21日作者：文章转自网络，版权归原作者所有，反馈可立刻删除

概览

Structured Streaming 是一个可拓展，容错的，基于Spark SQL执行引擎的流处理引擎。使用小量的静态数据模拟流处理。伴随流数据的到来，Spark SQL引擎会逐渐连续处理数据并且更新结果到最终的Table中。你可以在Spark SQL上引擎上使用DataSet/DataFrame API处理流数据的聚集，事件窗口，和流与批次的连接操作等。最后Structured Streaming 系统快速，稳定，端到端的恰好一次保证，支持容错的处理。

小样例

import org.apache.spark.sql.functions._import org.apache.spark.sql.SparkSession

val spark = SparkSession
  .builder
  .appName("StructuredNetworkWordCount")
  .getOrCreate()import spark.implicits._

val lines = spark.readStream
  .format("socket")
  .option("host", "localhost")
  .option("port", 9999)
  .load()// Split the lines into wordsval words = lines.as[String].flatMap(_.split(" "))// Generate running word countval wordCounts = words.groupBy("value").count()
val query = wordCounts.writeStream
  .outputMode("complete")
  .format("console")
  .start()

query.awaitTermination()

编程模型

结构化流的关键思想是将实时数据流视为一个连续附加的表

基本概念

将输入的数据当成一个输入的表格，每一个数据当成输入表的一个新行。

<h3>网友评论</h3>  <div class="ds-thread" data-thread-key="blog9442" data-title="Spark结构式流编程指南" data-url="http://www.qingruanit.net:80//blog/23930/note9442.html"></div>   <script type="text/javascript"> var duoshuoQuery = {short_name:"qingruanit"}; (function() { var ds = document.createElement('script'); ds.type = 'text/javascript';ds.async = true; ds.src = (document.location.protocol == 'https:' ? 'https:' : 'http:') + '//static.duoshuo.com/embed.js'; ds.charset = 'UTF-8'; (document.getElementsByTagName('head')[0] || document.getElementsByTagName('body')[0]).appendChild(ds); })(); </script>  </div> <div class="relatedarticle"> <h3>更多精彩分享</h3> <ul> </ul> <a class="img" href="http://www.qingruanit.net/c_online/p_yudingshitingke.html"><img alt="学习是年轻人改变自己的最好方式-Java培训机构,青岛Java培训,青岛计算机培训,软件编程培训,seo优化培训,网络推广培训,网络营销培训,SEM培训,网络优化,在线营销培训,Java培训" src="http://www.qingruanit.net/attached/image/templet/e87d53eb-cf7a-4689-887a-1cd260f416a5.jpg"><span>学习是年轻人改变自己的最好方式</span></a> </div> </div> <div style="margin-top: 20px;" id="hm_t_36603"></div> </div> </div> </div> <footer class="blog"> <p>栏目导航： <a href="c_study/" target="_self">如何学习软件</a> <a href="c_about/" target="_self">关于万码学堂</a> <a href="c_ask/" target="_self">关注点</a> </p> <p>旗下网站： <a href="http://www.qingsoft.cn" target="_blank">程序猿编程派</a> <a href="http://www.wanmait.com" target="_blank">万码学堂官网</a> </p> <p>青岛青软职业培训学校万码学堂（办学许可证编号：人社民3702023080012号）<a href="https://beian.miit.gov.cn/" target="_blank">鲁ICP备09077726号</a><a href="http://www.qingruanit.net">qingruanit.net</a></p> <p> <address> 青岛市市南区南京路122号B1栋3层咨询电话0532-85025005 </address> </p> <p><script language="javascript" type="text/javascript" src="http://js.users.51.la/17086740.js"></script> <noscript><a href="http://www.51.la/?17086740" target="_blank"><img alt="我要啦免费统计" src="http://img.users.51.la/17086740.asp" style="border:none" /></a></noscript></p> <p> <img src="images/fuze.gif"/> </p> </footer>  </div> <script src="/static/js/jquery-1.11.0.min.js"></script> <script src="/static/js/jquery-ui-1.10.4.custom.min.js"></script> <script type="text/javascript"> $(document) .ready( function() { if ($("#fixedmenu") && $("#themenu") && $("#themenu").offset()) { $(window) .scroll( function() { var wtop = $(window) .scrollTop(); var wleft = $(window) .scrollLeft(); if (wleft > 0) { $("#fixedmenu").css( "display", "none"); return; } if ($("#fixedmenu").html() == "") { $("#fixedmenu") .html( $( "#themenu") .html()); $("#fixedmenu").css( "top", "0"); } if (wtop < $("#themenu") .offset().top) { $("#fixedmenu").css( "display", "none"); } if ($("#fixedmenu") .outerHeight() > $( ".content2colsright") .offset().top + $( ".content2colsright") .outerHeight() - wtop) { //$("#fixedmenu").css("display","none"); $("#fixedmenu") .css( "top", -($( "#fixedmenu") .outerHeight() - ($( ".content2colsright") .offset().top + $( ".content2colsright") .outerHeight() - wtop)) + "px"); //$("#fixedmenu").css("left",$("#themenu").offset().left-wleft+"px"); } else if (wtop > $( "#themenu") .offset().top && $("#fixedmenu") .css( "display") != "block") { $("#fixedmenu").css( "display", "block"); $("#fixedmenu").css( "top", "0"); } else { $("#fixedmenu").css( "top", "0"); } }); } }); </script> </body> </html> <link href="http://www.qingruanit.net:80/editor/plugins/code/shCoreDefault.css" rel="Stylesheet" type="text/css" /> <script src="http://www.qingruanit.net:80/editor/plugins/code/shCore.js"></script> <script type="text/javascript"> $(document).ready( function(){ SyntaxHighlighter.all(); } ); </script>

分类导航

Spark结构式流编程指南

概览

小样例

编程模型

基本概念