⑴ hive 调用python 写的udf 报错
你把print写在try里面当然会少数据。你应该try访问fields数组并更新fields[2]的值。另一方面,从功能点上亏弊来说,使用SQL函数nvl或coalesce就能实现,没必要写个UDF来悄段实现,你这销运族样做增加额外的IO消耗和工作量。如果一定要写UDF,建议少用print,改用标准输出实现:sys.stdout.write()。