Cómo utilizar OCR para transcribir y traducir documentos genealógicos

En el fascinante mundo de la genealogía, la posibilidad de acceder y analizar documentos antiguos es de vital importancia para descubrir y comprender nuestras raíces familiares. Sin embargo, la tarea de transcribir y traducir estos documentos puede resultar tediosa y consume mucho tiempo. ¡Pero no te preocupes más! En este artículo, te mostraremos cómo utilizar OCR (Reconocimiento Óptico de Caracteres) para agilizar este proceso y obtener resultados precisos al transcribir y traducir documentos genealógicos. ¡Descubre las herramientas y técnicas que te permitirán avanzar en tu investigación de forma eficiente y efectiva!

Si alguna vez ha transcrito a mano el texto de un registro genealógico antiguo, sabrá el tiempo que puede llevar esta tarea. Incluso si solo planea extraer la información más importante de un registro para incluirla en su árbol genealógico, el proceso puede resultar desalentador. Muchos de nosotros simplemente no podemos encontrar el tiempo para ello, especialmente cuando tenemos muchas grabaciones que requieren transcripciones completas.

Afortunadamente, la tecnología moderna ha hecho que sea más fácil que nunca delegar esta tarea a una computadora. Te mostraremos cómo.

¿Por qué debería transcribir mis registros genealógicos?

La transcripción significa copiar la información de un documento basado en una imagen (o PDF) (un archivo que de otro modo sería ilegible e imposible de buscar) y convertirlo en texto que sea fácilmente legible, buscable y editable.

Haga descubrimientos instantáneos en su árbol genealógico ahora

Imagínese agregar su árbol genealógico a un sitio web simple y obtener instantáneamente cientos de nuevos descubrimientos de historia familiar. MyHeritage ofrece dos semanas de acceso gratuito a su amplia colección de 18 mil millones de registros históricos, así como a su tecnología de comparación que le brinda instantáneamente nueva información sobre sus antepasados. Regístrese utilizando el enlace a continuación para descubrir qué puede aprender sobre su familia.

La mayoría de los árboles genealógicos le permiten agregar una transcripción de una fuente basada en una imagen (o PDF) al agregarla a su árbol, lo que puede facilitar su investigación futura. Una vez que la información se transcribe a partir de una imagen grabada, el texto se puede agregar fácilmente a su árbol genealógico de diversas maneras y luego se puede buscar, ya sea por usted en su propia computadora, a través de su programa de árbol genealógico, o por otros si usa un entorno de colaboración en línea (como Ancestry).

Aquí es donde verás el campo de transcripción de Ancestry cuando cites un registro externo (un registro que encontraste en otro lugar y agregaste a tu árbol de Ancestry) O un registro que encontraste en Ancestry.


Cómo utilizar OCR para transcribir y traducir documentos genealógicos>

Tomarse el tiempo para extraer el texto y colocarlo junto a la información de la cita hará que sus materiales sean más valiosos para todos. (Si no estás seguro de cómo adjuntar fuentes externas a tu tronco de Ancestry o editar fuentes que encontraste en Ancestry, puedes usar nuestro Curso intensivo de ascendencia donde cubrimos esto en detalle).

Es posible que también desee guardar una transcripción completa de una grabación en sus archivos personales para poder buscar más fácilmente grabaciones e información en su programa para tomar notas o en su computadora. O tal vez desee publicar sus hallazgos en línea, convertir su investigación en un libro algún día o compartir su investigación con su familia por correo electrónico. En todos estos casos, una transcripción de la imagen del documento puede resultar de gran ayuda.

La transcripción de documentos también le permite capturar la información de un archivo PDF o una imagen, guardarla y compartirla en lugares donde solo se permite texto. Una de las mayores ventajas de esto es la traducción. Los documentos extranjeros se pueden transcribir mediante OCR, limpiarlos y luego copiarlos en una herramienta de traducción como Traductor de Google. Esto no le dará una traducción perfecta, pero es un buen comienzo para comprender mejor la vida de sus antepasados.

Quizás quieras transcribir:

  • Recortes de periódico
  • Secciones de viejos libros de familia.
  • Signos vitales
  • Expedientes de pensiones
  • Tarjetas de borrador
  • Secciones de registros censales
  • Testamentos o archivos patrimoniales
  • Y la lista sigue y sigue

Aquí aprenderás cómo crear transcripciones de forma fácil y gratuita.

18 mil millones de registros genealógicos gratuitos durante dos semanas

Ahora obtenga dos semanas completas de acceso gratuito a más de 18 mil millones de registros genealógicos. También obtienes acceso a la herramienta de descubrimiento MyHeritage, que encuentra automáticamente información sobre tus antepasados ​​cuando cargas o creas un árbol genealógico. ¿Qué aprenderás sobre el pasado de tu familia?

Aunque nunca existe un sustituto para la transcripción manual cuidadosa, la solución más sencilla para transcribir sus registros genealógicos es utilizar OCR moderno. OCR significa reconocimiento óptico de caracteres y hay una variedad de opciones disponibles en línea, como aplicaciones, en impresoras y escáneres, y como programas descargables.

El primer paso en este proceso es hacer que sus documentos estén disponibles en formato digital, como PDF o imagen (JPG, etc.). Puede escanear documentos en papel para convertirlos en digitales antes de aplicar OCR, o puede aplicar OCR mientras Ellos escanean. Puede encontrar más información sobre esto al final de este artículo. El resto de esta guía supone que se trata de registros digitales.

Probamos varias soluciones de OCR, incluidas FineReader y Google Docs, y descubrimos que es una opción en línea gratuita para nuestros propósitos. OCR en línea en realidad proporcionó los resultados más precisos. Además, es muy rápido y fácil de usar.

Sin embargo, cada documento es diferente y cada programa disponible tiene fortalezas y debilidades. Estos programas pueden producir resultados completamente diferentes en diferentes circunstancias. Es por eso que hemos incluido una lista de otras opciones para que pruebes al final de este artículo.

Antes de sumergirnos en el uso del OCR en línea, es necesario comprender las limitaciones de esta tecnología. El OCR hace un trabajo bastante bueno al leer y transcribir texto impreso (mecanografiado) en registros nuevos y antiguos, pero ningún OCR ampliamente disponible todavía es capaz de procesar escritura a mano de manera confiable. Hay algunos programas que afirman ser capaces de hacer esto, pero sólo pueden leer escritura a mano para la cual el programa ha sido capacitado para comprender. Esto significa que es posible que pueda enseñarle al programa a reconocer su propia escritura, pero probablemente no podrá leer ni transcribir fácilmente el texto escrito a mano en documentos antiguos. En cualquier caso, quién sabe dónde estará esta tecnología dentro de unos años.

Incluso el texto impreso no sale perfecto, como verá a continuación. En general, cuanto más claro sea el texto, mejor será la transcripción.

Para comenzar a transcribir sus propias grabaciones a través de este sitio web gratuito, simplemente vaya a OCR en línea.

En la captura de pantalla siguiente, puede ver que sólo tiene algunas opciones para elegir: el archivo, el idioma del documento y el formato de salida.


Cómo utilizar OCR para transcribir y traducir documentos genealógicos>

Para este recorrido de ejemplo, seleccionamos una tarjeta de inscripción al reclutamiento de la Segunda Guerra Mundial (parte del llamado «Llamamiento del Viejo») que se encuentra en FamilySearch. Contiene texto en dos formas: el texto original del documento impreso y las respuestas mecanografiadas. Después de seleccionar el archivo, seleccionamos inglés como idioma y Microsoft Word como formato. Esto crea el texto transcrito en un cuadro fácil de copiar y como un archivo descargable.

Aquí está el documento original.


Cómo utilizar OCR para transcribir y traducir documentos genealógicos>

Esto es lo que vemos después de convertir el archivo.


Cómo utilizar OCR para transcribir y traducir documentos genealógicos>

Y aquí está el texto, exactamente como fue creado por el lector OCR. Puedes ver que está lejos de ser perfecto. Se omitieron todas las áreas del texto escrito a mano, como el número de serie, y varias secciones del texto impreso se transcribieron incorrectamente como una mezcla de caracteres. El espaciado también es incorrecto, por lo que en algunos casos las respuestas muestran múltiples espacios debajo de las preguntas.

Aún así, en general hizo un trabajo bastante bueno. Ejecutamos el mismo conjunto de datos de diseño utilizando varios otros programas de OCR y esta opción produjo el resultado más preciso. El texto se puede limpiar con relativa facilidad y, ciertamente, en mucho menos tiempo que si se empezara desde cero.

TARJETA DE REGISTRO – (Hombres nacidos a partir del 28 de abril de 1877 y antes del 16 de febrero de 1897)
NÚMERO DE SERIE I. NAVE (Imprimir)

John Zdward Quinn (Lac.)
NÚMERO DE ORDEN
2. l’I.ArE Or lle,;1,ENCE (Imprimir) 7 Richmond St4 Dover, Strafford, New Hampshire (Numb, out ”tre41t) (Pueblo. townahip. pueblo. o ciudad) Condado) (Estado)
[THE PLACE OF RESIDENCE GIVEN ON THE LINE ABOVE WILL DETERMINE LOCAL BOARD JURISDICTION; LINE 2 OF REGISTRATION CERTIFICATE WILL BE IDENTICAL] 3. ENVÍO AZ)1)REUS
La misma cosa. lMniling …Lire*. si es diferente a la ubicación especificada en la línea 2. Si se inserta un cálculo…rd anestesiado)
4. TELEPILÓN 13-14 – VE
– EDAD EN AÑOS
58
C., CE DEL ‘NACIMIENTO
FECHA DE BIRTEI 15 de julio de 18.83Orr.) (Intercambio) (Número) (Mu( 7. NOMBRE Y DIRECCIÓN (SI PERSONA QUE SIEMPRE SABRÁ SU DIRECCIÓN
Dover. Corona o condado)
Nuevo_ (estado o país)
MissMary_ Quinn 7 Richmond St Dover, NHS NOMBRE Y DIRECCIÓN DEL EMPLEADOR Desempleado 9.P1.-AFE-01* EMPLEADO O Bt
Ilhervoloyed (número ir) I ..rIt. Adaptar. Número)
(propio) ‘unty)
(Condición)
Confirmo que he comprobado las respuestas anteriores y que están bien. Formulario DSS. 1 1(1-21n30-2 (Revisado el 4-1-42) (arriba) (Propiedad del registrante)[AVEVERIFICADOARRIBARESPUESTASYQUETATTIIEARETRIMDSSForm11(1-21n30-2(Revisadoel4-1-42)(arriba)(Firmadelregistrante)[AVEVERIFIEDABOVEANSWERSANDTHATTIIEARETRIMDSSForm11(1-21n30-2(Revised4-1-42)(over)(Registrant’seignirture)

Independientemente de si tiene errores de transcripción graves como los anteriores, Debe leer la transcripción con mucha atención y compararla con el documento original antes de agregar la información de la cita.notas personales o en línea.

E igual de importante: siempre, siempre debes hacerlo. Si es posible, vincule o adjunte la fuente de la grabación original a su transcripción.. Deje en claro de dónde proviene la grabación, cuándo se grabó, qué tipo de documento es, cómo se transcribió y cómo alguien puede acceder al original. A menudo puede encontrar información completa de citas para una colección de registros en la página de búsqueda de esa colección (esto es cierto para la mayoría de las bases de datos importantes, como FamilySearch, MyHeritage o Ancestry). Utilice esta información junto con una nota que indique que usted la transcribió (en qué fecha) y guárdela con su transcripción.

Más opciones para usar OCR al transcribir.

Si está transcribiendo documentos sin conexión, debe saber que muchas impresoras más nuevas tienen una opción de OCR incorporada. Puedes escanear y transcribir todo en uno. También hay una variedad de escáneres portátiles y aplicaciones que aplican OCR mientras escanean y pueden lograr lo mismo.

Aquí hay algunas opciones digitales que no requieren hardware. Dado que cada documento y cada necesidad es diferente, le recomendamos que pruebe varias opciones para sus propias necesidades, ya que cada una puede producir resultados diferentes.

Documentos de Google – Google Docs puede transcribir documentos por usted y tiene una buena configuración. Primero, visite su Google Drive, cargue su archivo, luego haga clic derecho en el ícono de imagen rojo debajo del archivo y seleccione «Abrir con Google Docs». La transcripción tardará varios minutos. Si ya utiliza Google Docs, esta puede ser una buena solución y producir resultados agradables con la imagen y el texto originales en una sola página. Sin embargo, en nuestras propias pruebas fue menos precisa que la solución que se muestra en este artículo.

Abbyy FineReader en línea – Como parte de una versión de prueba, obtienes las primeras 10 páginas de forma gratuita. Luego deberá suscribirse a este programa en línea si desea continuar transcribiendo. Este programa produce resultados bien formateados, pero en general la parte transcrita produjo resultados menos precisos que otras soluciones y algunas secciones se omitieron por completo. Los costos también son muy altos.

Adobe Pro DC – Este es el programa para editar archivos PDF directamente desde Adobe e incluye OCR. Es un programa pago y se puede descargar. Es posible que algunos de ustedes ya posean este programa si editan archivos PDF por otros motivos.

Aplicaciones: consulte la tienda de aplicaciones de su teléfono o tableta (busque LOC o escáner), ya que ahora hay una serie de opciones que pueden resultar muy útiles, especialmente si desea transcribir sobre la marcha o si sus documentos están actualmente sin conexión.

¡Diviértete transcribiendo!

Por Melanie Mayo, editora del Family History Daily

Error 403 The request cannot be completed because you have exceeded your quota. : quotaExceeded




Cómo utilizar OCR para transcribir y traducir documentos genealógicos

Preguntas frecuentes sobre el uso de OCR para transcribir y traducir documentos genealógicos

Si te encuentras investigando tu árbol genealógico y tienes documentos en diferentes idiomas que deseas transcribir y traducir, el uso de OCR puede ser una herramienta muy útil. Aquí algunas preguntas frecuentes que te ayudarán a comprender cómo utilizar OCR para este propósito.

1. ¿Qué es OCR?

OCR (Reconocimiento Óptico de Caracteres, por sus siglas en inglés) es una tecnología que permite analizar imágenes o documentos escaneados para extraer y reconocer automáticamente el texto presente en ellos. Esto facilita enormemente la conversión de documentos físicos a formato digital.

2. ¿Cómo funciona el OCR?

El OCR utiliza algoritmos avanzados que analizan los patrones de luz y sombra presentes en una imagen o documento escaneado. A través de la comparación de estos patrones con una base de datos de caracteres conocidos, el OCR identifica y reconoce las letras y palabras contenidas en el documento.

3. ¿Cuáles son las ventajas de utilizar OCR en la transcripción y traducción de documentos genealógicos?

El uso de OCR en la transcripción y traducción de documentos genealógicos ofrece varias ventajas:

  1. Ahorro de tiempo: OCR permite transcribir rápidamente grandes cantidades de texto, evitando así la necesidad de realizarlo manualmente.
  2. Precisión: Aunque el OCR puede cometer algunos errores al reconocer caracteres y palabras, su precisión general es alta, lo que reduce la posibilidad de errores humanos.
  3. Traducción automática: Al combinar OCR con herramientas de traducción automática, puedes obtener la traducción de tus documentos genealógicos de forma rápida y eficiente.

4. ¿Qué consideraciones debes tener en cuenta al utilizar OCR en documentos genealógicos?

Es importante tener en cuenta algunas consideraciones al utilizar OCR en documentos genealógicos:

  1. Calidad de la imagen: La calidad de la imagen escaneada puede afectar la precisión del OCR. Asegúrate de escanear los documentos en alta resolución y en un formato de imagen compatible con el software OCR.
  2. Idioma y escritura: Al utilizar OCR, es fundamental que el software esté configurado para reconocer el idioma y la escritura específicos contenidos en tus documentos. Verifica la compatibilidad del OCR con el idioma que necesitas transcribir y traducir.
  3. Revisión manual: Aunque el OCR ofrece una transcripción automática, siempre es recomendable realizar una revisión manual para corregir posibles errores y garantizar la precisión de la transcripción y traducción.

Si deseas obtener más información sobre OCR y cómo utilizarlo en la transcripción y traducción de documentos genealógicos, te recomendamos visitar los siguientes recursos:

Con el uso de OCR, podrás transcribir y traducir tus documentos genealógicos de manera eficiente y precisa, facilitando así tu investigación y comprensión de tu historia familiar.


Deja un comentario