(加西网综合)加拿大审计总长最新报告披露,加拿大税务局(CRA)耗资 1,800 万加元开发并维护的税务咨询聊天机器人“Charlie”,在她的测试中有 66% 的回答是错误的。
这一结果引发国会议员震惊,并让外界质疑 CRA 在人工智能工具上的高额投资是否物有所值。

(加国政府截图)
上线 6 年、花费 1,800 万,“Charlie”仍然常答错
“Charlie”于 2020 年 2 月由时任国家税务部长 Diane Lebouthillier 推出。CRA 当时称它能协助民众解答一般的报税问题,但仍在“学习阶段”。
五年过去,审计总长凯伦·霍根(Karen Hogan)在 10 月发布的报告中批评说:“Charlie 的回答通常过于简短,缺乏必要背景及说明”。
审计人员共提出 6 个问题,Charlie 只答对了 2 个;相比之下,网络上其他公开可用的 AI 工具答对了 5 个。
自由党议员 Anthony Housefather 在听证会上表示震惊:“政府专门为 CRA 打造的工具,为什么比一般公众都能免费使用的 AI 还差?”
1,800 万加元去哪了?大量资金用于薪资与顾问费
根据本周提交国会的文件,自 2018-2019 财年以来,CRA 已投入:
薪资成本:1,367 万加元(不含福利与差旅)
IT 顾问费用:321 万加元
尽管“Charlie”的表现欠佳,但 CRA 指出,其在 6 年内已与用户进行了超过 700 万次对话,回答了 1,800 万个问题。
CRA 也承认过去的 chatbot 表现不稳定,内部评估的“准确度门槛”曾只有 70%。
CRA:新一代 AI 版本准确度达 90%(内部测试)
今年 11 月,CRA 推出升级版的生成式 AI Chatbot,类似 ChatGPT,可回答更多复杂问题。
CRA 声称测试结果显示其准确率达 约 90%,但也承认:“若不逐一评估所有对话记录,无法准确得知实际答对多少问题”。
与此同时,Charlie 的使用者提出的问题范围极广:
2024 年报税季前夕,Charlie 被问了数十万条与个人所得税相关的问题
2 至 4 月间有关“电子服务”的询问超过 43 万条
数千条问题涉及商业税、福利、积分、账户信息更新等
近 18 万条互动被归类为‘闲聊(chit chat)’