Sai sót trong kế toán có thể dẫn tới hậu quả pháp lý rất nghiêm trọng, nhất là khi xử lý chứng từ và hóa đơn không đúng quy định. Tại Việt Nam, câu nói đùa “Kế toán – nghề dễ đi tù nhất” đã trở thành một meme phổ biến phản ánh thực tế này. Với các freelancer và doanh nghiệp nhỏ thường tự làm sổ sách mà không có chuyên viên kế toán riêng, việc quản lý hàng trăm hóa đơn mỗi năm bằng thủ công tạo ra nhiều nguy cơ sai sót và phiền toái trong quá trình kê khai thuế.
Một lập trình viên gốc Siberia hiện sinh sống tại Đức đã tự phát triển một ứng dụng dựa trên trí tuệ nhân tạo nhằm giải quyết khó khăn này. Là người làm freelancer, anh thường phải dành cả tuần vào mùa thuế để phân loại hóa đơn tích lũy trong năm. Sau nhiều lần thử sử dụng các phần mềm kế toán truyền thống nhưng cảm thấy không phù hợp với cách làm việc cá nhân hoặc bị giới hạn bởi chi phí bản quyền cao, anh quyết định xây dựng một công cụ mới. Ứng dụng do anh thiết kế dùng mô hình ngôn ngữ lớn (LLM) để tự động đọc và phân loại hóa đơn, đồng thời được phát hành mã nguồn mở theo giấy phép MIT cho cộng đồng.

Ứng dụng AI đọc hóa đơn tự động
Tên ứng dụng là TaxHacker, hoạt động theo quy trình đơn giản và linh hoạt: người dùng chỉ cần tải lên hình ảnh hóa đơn, biên lai hoặc file PDF, hệ thống sẽ chuyển tài liệu đến các LLM đa phương thức như OpenAI, Google Gemini hay Mistral để nhận diện nội dung. Ngay lập tức, ứng dụng trích xuất các thông tin quan trọng như ngày tháng giao dịch, số tiền thanh toán, tên nhà cung cấp, danh sách sản phẩm và thuế kèm theo rồi tự động phân loại và lưu vào cơ sở dữ liệu dưới dạng bảng tính tiện lợi. TaxHacker có khả năng xử lý đa dạng loại giấy tờ gồm hóa đơn cửa hàng, biên lai nhà hàng, sao kê ngân hàng thậm chí cả các hóa đơn viết tay bằng nhiều thứ tiếng khác nhau. Đặc biệt hơn nữa là khả năng tách từng mục trên một hóa đơn thành các khoản giao dịch riêng biệt để quản lý chi tiết.
Khả năng nhận diện văn bản qua OCR bằng AI đã không còn mới mẻ song điểm nổi bật của dự án nằm ở triết lý thiết kế mở và dễ tùy biến. Toàn bộ câu lệnh (prompt) gửi cho AI đều được mở để người dùng có thể chỉnh sửa theo nhu cầu cá nhân. Người dùng có thể tạo ra số lượng trường dữ liệu tùy ý với mỗi trường tương ứng một prompt riêng biệt giúp AI biết chính xác những thông tin cần trích xuất. Thậm chí hệ thống chung cũng được phép điều chỉnh ngay trong phần cài đặt. Lý do đằng sau thiết kế này được tác giả giải thích là vì hầu hết các phần mềm kế toán hiện nay thường ép người dùng vào khuôn khổ cố định với những trường bắt buộc đôi khi không cần thiết gây phiền phức và mất thời gian cho người dùng.

Giao diện ứng dụng TaxHacker
TaxHacker còn trang bị tính năng nhận diện tiền tệ thông minh khi tự động xác định loại tiền trong tài liệu rồi quy đổi theo tỷ giá lịch sử đúng ngày giao dịch. Ứng dụng hỗ trợ hơn 170 loại tiền tệ trên thế giới cùng 14 loại tiền mã hóa phổ biến như Bitcoin (BTC), Ethereum (ETH), Litecoin (LTC), Polkadot (DOT) phục vụ tốt nhu cầu của freelancer nhận thanh toán đa quốc gia hoặc qua crypto.
Về phần kỹ thuật, ứng dụng được xây dựng trên nền tảng Next.js phiên bản 15 trở lên cùng cơ sở dữ liệu PostgreSQL phiên bản 17 trở lên và triển khai qua Docker Compose với hai container riêng biệt. Dữ liệu người dùng hoàn toàn lưu giữ trên máy chủ cá nhân đảm bảo tính bảo mật cao. Bên cạnh đó, TaxHacker cũng hỗ trợ tìm kiếm toàn văn nội dung tài liệu đã nhận diện, lọc nâng cao theo nhiều tiêu chí khác nhau, xuất dữ liệu dạng CSV kèm file đính kèm và thực hiện thao tác hàng loạt giúp tăng hiệu quả quản lý.
Tuy nhiên dự án vẫn đang trong giai đoạn phát triển sơ khai với một số hạn chế cần lưu ý. Phần mềm chưa tích hợp công cụ lập hóa đơn (invoicing), quản lý bảng lương (payroll) hay hệ thống sổ kép kế toán chuyên nghiệp mà chỉ đóng vai trò như công cụ theo dõi chi phí kết hợp phân tích tài liệu. Hiện cũng chưa hỗ trợ đầy đủ tính năng cộng tác nhiều người dùng hay ứng dụng mobile chính thức. Ngoài ra do phụ thuộc API từ các nhà cung cấp LLM nên vẫn phát sinh chi phí vận hành AI mặc dù tác giả đang lên kế hoạch bổ sung khả năng chạy mô hình LLM cục bộ trong tương lai gần. Cộng đồng sử dụng hiện còn khá nhỏ với khoảng 250 lượt yêu thích trên GitHub.
Tác giả cho biết đã áp dụng TaxHacker để xử lý hơn 200 hóa đơn cho năm tài chính 2024 và dự kiến phát triển thêm các tính năng tự động tổng hợp báo cáo VAT định kỳ theo quý, nhắc nhở hạn nộp thuế đúng hạn, đánh dấu những giao dịch thiếu dữ liệu quan trọng và cho phép tái phân tích hàng loạt khi thay đổi prompt trích xuất thông tin. Mã nguồn mở miễn phí theo giấy phép MIT dành cho những ai am hiểu Docker muốn kiểm soát tối đa dữ liệu tài chính cá nhân mà không phải phụ thuộc vào phần mềm bên thứ ba. Dù vậy tác giả vẫn nhấn mạnh “chị kế toán” truyền thống vẫn là lựa chọn đáng tin cậy nhất mà chưa có AI nào thay thế hoàn toàn.