大数据|数据读取与保存Sequence文件_大数据培训 spark|scala

Sequence文件
SequenceFile文件是Hadoop用来存储二进制形式的key-value对而设计的一种平面文件(Flat File)。Spark 有专门用来读取 SequenceFile 的接口。在 SparkContext 中，可以调用 sequenceFile[keyClass, valueClass](path)。
注意：SequenceFile文件只针对PairRDD
（1）创建一个RDD
scala> val rdd = sc.parallelize(Array((1,2),(3,4),(5,6)))
rdd: org.apache.spark.rdd.RDD[(Int, Int)] = ParallelCollectionRDD[13] at parallelize at :24
【大数据|数据读取与保存Sequence文件_大数据培训】（2）将RDD保存为Sequence文件
scala> rdd.saveAsSequenceFile(“file:///opt/module/spark/seqFile”)
（3）查看该文件

文章图片

（4）读取Sequence文件
scala> val seq = sc.sequenceFile[Int,Int](“file:///opt/module/spark/seqFile”)
seq: org.apache.spark.rdd.RDD[(Int, Int)] = MapPartitionsRDD[18] at sequenceFile at :24
（5）打印读取后的Sequence文件
scala> seq.collect
res14: Array[(Int, Int)] = Array((1,2), (3,4), (5,6))

大数据|数据读取与保存Sequence文件_大数据培训

推荐阅读

t值分析方法

螃蟹哪个部位排泄

916黄金能换999黄金吗

手机网络变慢怎么处理

致敬最美逆行者的句子致敬最美逆行者的句子50字

法院错判需要赔偿吗

口意什么意思

孩子睡觉磨牙是怎么回事睡觉磨牙是什么原因

铁锅|这样用锅，堪比服慢性毒药！无数家庭都在犯，再不改全家健康遭殃

伯纳天纯和佩玛斯特哪个好佩玛思特狗粮怎么样

五花肉怎么炒送给爱吃的你

杨梅汁是煮的好还是榨的好

氯化钾和硝酸银反应的化学方程式氯化钾和硝酸银反应的化学方程式是什么

rootkit分析,电脑中Rootkit病毒怎么办

2019|2019 年百度之星·程序设计大赛 - 初赛一Game HDU 6669 (实现，贪心)

合同一方如何诉讼解除合同赔偿合同一方如何诉讼解除合同？

成都市非机动车管理条例成都市电动车管理新规2022

青瓜生菜汁什么时候喝最好

怎样才能报复父母如何报复出轨父亲，如何报复出轨的老公

原神鸦印记位置原神鸦印在哪刷