jjzjj

hadoop - 从 hdfs 读取数据时级联的实现问题

假设我在hdfs目录中有这些文件500/Customer/part-001500/Customer/part-002500/Customer/part-003是否可以检查元组来自哪个部分文件?注意:我已经研究过了,但一无所获。 最佳答案 你的问题不是很清楚。假设您的输出采用以下布局,分隔符为“;”身份证;姓名;年龄1;约旦;222;内森;33等等您可以使用awk或grep或两者来获取记录例如,如果你想搜索记录Nathan,试试文件命令grep-r"Nathan"部分*以上命令将搜索字符串“Nathan”,如果该字符串存在于任何部分文