Destilar•IADestilar•IA

Faturista
A Extração do Futuro

Um pequeno modelo de IA generativa especialista em extracção de dados estruturados apartir de documentos financeiros.

Baseado no modelo Qwen3-VL, com capacidades visuais, tem um melhor entendimento da estrutura dos documentos do que o OCR comum, especialmente em documentos emitidos em Portugal.

Dados fáceis, com zero prompts.

Aceder aos Modelos no Hugging Face

Demonstração

Fatura Original
100%
extracao_modelo.json

Perguntas Frequentes

Porque é que o Faturista é melhor que OCR?

O Faturista utiliza um modelo de visão-linguagem avançado que compreende a estrutura semântica dos documentos, enquanto o OCR tradicional apenas extrai texto sem contexto. Além disso, o Faturista foi treinado em centenas de documentos portugueses, com diferentes layouts. Isto resulta em maior precisão na identificação de campos complexos, melhor tratamento de layouts variados e menos erros em documentos portugueses com formatações específicas.

Quanto custa o Faturista e como posso aceder?

O Faturista é um modelo aberto e gratuito. Os ficheiros estão disponíveis no Hugging Face. Poderá também fazer download e experimentar, através de software para LLMs locais como o LM Studio. Consulte o nosso artigo.

Qual é a velocidade e que hardware preciso para o Faturista?

Com uma GPU moderna (ex: RTX 3060), o Faturista processa uma fatura em 2-5 segundos. O modelo requer aproximadamente 8GB de VRAM e pode funcionar em GPUs de consumidor. Na versão GGUF (quantizada a 4bit) o modelo é mais rápido e leve, o que permitirá correr em hardware mais limitado, mesmo sem GPUs. Com inferência baseada apenas em CPU o modelo poderá ter uma performance de 4-10tok/s, o que será suficiente para muitos casos e ideal para processamento em background.

Existe uma API para onde posso enviar ficheiros e obter os resultados?

Entre em contacto.

Detalhes Técnicos

O Faturista é baseado no modelo Qwen3-VL-4B-Instruct, uma arquitetura de visão-linguagem de última geração. O modelo foi fine-tuned especificamente para a extração de dados estruturados de documentos financeiros portugueses.

Durante o treino, foram utilizados centenas de exemplos de faturas, recibos e documentos fiscais reais, garantindo uma compreensão robusta das variações de layout, terminologia e estruturas específicas do mercado português.

O modelo gera um output consistente de uma estrutura JSON estática. As alucinações são praticamente inexistentes. Mas, na versão GGUF, pode ser usado um grammar file para restringir a estrutura do output ao JSON esperado. Este ficheiro está disponível no repositório da versão GGUF.

Formato dos Inputs

O Faturista recebe 1 ou mais imagens. No caso de documentos multi-página, deve-se usar uma imagem por página. As imagens podem ser enviados em conjunto, para que os dados sejam agregados no mesmo output. No caso de limitações de memória, podem ser feitas em separado. O Faturista também está preparado para extrair linhas sem qualquer informação de cabeçalho.

Ficheiros PDFs devem primeiro ser convertidos em imagens.

O Faturista foi treinado com imagens de diferentes resoluções e qualidades. No entanto, para aumentar a taxa de sucesso, as imagens devem ter uma boa resolução (1280px de largura).

Parâmetros de Inferência

Parâmetros aconselhados para a inferência:

  • temperature: 0 a 0.8
  • top_p: 1
  • top_k: 40