Encontre a resposta que está procurando

Node PDF Parse

O node PDF Parse está localizado na categoria Nodes Parser. Este node é utilizado para extrair texto de um arquivo PDF.

▶No vídeo a seguir, explicamos os parâmetros para configurá-lo:


Abaixo, você encontra a descrição dos campos que utilizará no processo, como mostrado no vídeo👇

  1. Nome (opcional): nome do node; aqui você pode alterar o valor padrão.
  2. Base 64 string: você deverá incorporar o arquivo PDF em formato de texto plano base64.
  3. Output path: nome da variável onde o texto analisado será armazenado.

▶Adicionalmente, no resultado do node, você encontrará os seguintes parâmetros de saída:

  • numpages: a quantidade de páginas do PDF.
  • numrender: a quantidade de páginas renderizadas do PDF.
  • info: informações complementares do PDF (título, autor, data de criação, etc.).
  • metadata
  • version: versão do PDF.js (a biblioteca que executa o parsing).
  • text: o texto extraído do PDF.

➡Baixe o fluxo com o exemplo neste link.

Tenha em mente:

Se você usar o exemplo, adicione um node Inject antes do node PDF Parse, que deverá conter o arquivo codificado em base64.

Este site armazena cookies em seu computador. Estes cookies são utilizados para coletar informações de como você interage com o nosso site e nos permite lembrar de você. Nós usamos essa informação para melhorar e personalizar sua experiência de navegação e para obter estatísticas e métricas sobre nossos visitantes, tanto neste site quanto em outros meios. Para obter mais informações sobre os cookies que utilizamos, consulte nossa Política de Privacidade.

Se você recusar, sua informação não será rastreada quando você visitar este site. Será utilizado somente um cookie em seu navegador para lembrá-lo de sua preferência de não ser rastreado.