我有一個xlsx文件一欄;
百分比
30%
40%
50%
-10%
0.00%
0%
0.10%
110%
99.99%
99.98%
-99.99%
-99.98%
當我讀到這個使用Apache-Spark把我得到的是,
| |百分比
+ - - - - - - - - - - - +
| 0.3 |
| 0.4 |
| 0.5 |
| -0.1 |
| 0.0 |
| 0.0 |
| 0.001 |
| 1.1 |
| 0.9999 |
| 0.9998 |
+ - - - - - - - - - - - +
預期的輸出,
+ - - - - - - - - - - - +
| |百分比
+ - - - - - - - - - - - +
| | 30%
| | 40%
| | 50%
| | -10%
| | 0.00%
| | 0%
| | 0.10%
| | 110%
| | 99.99%
| | 99.98%
+ - - - - - - - - - - - +
我的代碼,
val火花= SparkSession
.builder
.appName (“trimTest”)
部分(“地方[*]”)
.getOrCreate ()
val df = spark.read
.format (“com.crealytics.spark.excel”)。
選項(“頭”,“真正的”)。
選項(“maxRowsInMemory”, 1000)。
選項(“inferSchema”,“真正的”)。
負載(“數據/ percentage.xlsx”)
df.printSchema ()
df.show (10)
我不想使用鑄造或inferschema變成假的,我想要一個百分比值百分比不讀或字符串的兩倍。