jjzjj

Extracting

全部标签

关于 apache spark:Extracting value using Window and Partition

ExtractingvalueusingWindowandPartition我在pyspark中有一个数据框12345678910id|value1  01  11  02  12  03  03  03  1我想提取同一id组中value列中第一次出现1之后的所有行。我创建了带有Id分区的窗口,但不知道如何获取值1之后存在的行。我期待结果是1234567 id|value  1  1  1  0  2  1  2  0  3  1你有定义窗口内排序的东西吗?否则我认为结果将是不确定的我只能按id列订购。底层数据模型是一个集合,而不是一个列表,例如对于id=1,值0、1和0可以按任何顺序处理。

关于 apache spark:Extracting value using Window and Partition

ExtractingvalueusingWindowandPartition我在pyspark中有一个数据框12345678910id|value1  01  11  02  12  03  03  03  1我想提取同一id组中value列中第一次出现1之后的所有行。我创建了带有Id分区的窗口,但不知道如何获取值1之后存在的行。我期待结果是1234567 id|value  1  1  1  0  2  1  2  0  3  1你有定义窗口内排序的东西吗?否则我认为结果将是不确定的我只能按id列订购。底层数据模型是一个集合,而不是一个列表,例如对于id=1,值0、1和0可以按任何顺序处理。
12