EXTRAER CONTENIDO (TEXTO) DE UN ARCHIVO PDF (con iTextSharp.dll)

Dim oReader As New iTextSharp.text.pdf.PdfReader(PdfFileName)
Dim its As New iTextSharp.text.pdf.parser.SimpleTextExtractionStrategy

DocumentText = iTextSharp.text.pdf.parser.PdfTextExtractor.GetTextFromPage(oReader, 1, its)


oReader.Close()

'http://sourceforge.net/projects/itextsharp/

2 comentarios:

  1. hola tenes idea de como obtener un texto solamente de un campo del pdf

    ResponderEliminar
  2. a ver si me explico, el pdf tiene mucho texto pero dos campos variables que son numero de expediente, necesito solo obtener el texto de esos campos

    ResponderEliminar