Skip to content

Pure Javascript OCR for more than 100 Languages 📖🎉🖥

License

Notifications You must be signed in to change notification settings

blyzer/tesseract.js

 
 

Repository files navigation

Tesseract.js

Build Status Gitpod Ready-to-Code Financial Contributors on Open Collective npm version Maintenance License Code Style Downloads Total Downloads Month Actions Panel

La versión 2 ya está disponible y en desarrollo en la rama maestra, lea una historia sobre v2: Why I refactor tesseract.js v2?
Comprobar el soporte / 1.x rama para la versión 1


Tesseract.js es una librería de javascript que introduce palabras en almost any language de las imágenes. (Demo)

Reconocimiento de imágenes

fancy demo gif

Video Reconocimiento en tiempo real

Tesseract.js Video

Tesseract.js envuelve un emscripten port del Tesseract OCR Motor. Funciona en el navegador usando webpack o etiquetas de escritura simple con un CDN y en el servidor con Node.js. Después de ti install it, Usarlo es tan simple como:

import Tesseract from 'tesseract.js';

Tesseract.recognize(
  'https://tesseract.projectnaptha.com/img/eng_bw.png',
  'eng',
  { logger: m => console.log(m) }
).then(({ data: { text } }) => {
  console.log(text);
})

O más imperativo

import { createWorker } from 'tesseract.js';

const worker = createWorker({
  logger: m => console.log(m)
});

(async () => {
  await worker.load();
  await worker.loadLanguage('eng');
  await worker.initialize('eng');
  const { data: { text } } = await worker.recognize('https://tesseract.projectnaptha.com/img/eng_bw.png');
  console.log(text);
  await worker.terminate();
})();

Check out the docs para una explicación completa de la API.

Cambios importantes en la v2

  • Actualizar a tesseract v4.1 (usando emscripten 1.38.45)
  • Soporta varios idiomas al mismo tiempo, por ejemplo: eng+chi_tra para el inglés y el chino tradicional
  • Formatos de imagen soportados: png, jpg, bmp, pbm
  • Soportar WebAssembly (volver a ASM.js cuando el navegador no lo soporte)
  • Tipografía de apoyo

Instalación

Tesseract.js funciona con una etiqueta <script> a través de una copia local o CDN, con un webpack a través de npm y en Node.js con npm/yarn.

CDN

<!-- v2 -->
<script src='https://unpkg.com/tesseract.js@v2.0.2/dist/tesseract.min.js'></script>

<!-- v1 -->
<script src='https://unpkg.com/tesseract.js@1.0.19/src/index.js'></script>

Después de incluir el guión la variable Tesseract estará disponible globalmente.

Node.js

Tesseract.js actualmente requiere Node.js v6.8.0 o superior

# For v2
npm install tesseract.js
yarn add tesseract.js

# For v1
npm install tesseract.js@1
yarn add tesseract.js@1

Documentación

Usa tesseract.js de la manera que te gusta!

Contribuyendo

Desarrollo

Para ejecutar una copia de desarrollo de Tesseract.js haga lo siguiente:

# Primero clonamos el depósito
git clone https://github.com/naptha/tesseract.js.git
cd tesseract.js

# Luego instalamos las dependencias
npm install

# Y finalmente iniciamos el servidor de desarrollo
npm start

El servidor de desarrollo estará disponible en http://localhost:3000/examples/browser/demo.html en su navegador favorito. Reconstruirá automáticamente tesseract.dev.js y worker.dev.js cuando cambie los archivos en la carpeta src..

Configuración en línea con un solo clic

Puedes usar Gitpod (un código VS online gratuito como el IDE) para contribuir. Con un solo clic se lanzará un espacio de trabajo listo para codificar con los scripts de construcción y arranque ya en proceso y en unos pocos segundos hará girar el servidor de desarrollo para que puedas empezar a contribuir de inmediato sin perder tiempo.

Open in Gitpod

Construir archivos estáticos

Para construir los archivos estáticos compilados, simplemente ejecute lo siguiente:

npm run build

Esto hará que los archivos salgan en el directorio `dist'.

Contribuyentes

Code Contributors

Este proyecto existe gracias a todas las personas que contribuyen. [Contribuir].

Financial Contributors

Conviértase en un contribuyente financiero y ayúdenos a mantener nuestra comunidad. [Contribuya]

Individuos

Organizaciones

Apoye este proyecto con su organización. Su logo aparecerá aquí con un enlace a su sitio web. [Contribuir]

About

Pure Javascript OCR for more than 100 Languages 📖🎉🖥

Resources

License

Security policy

Stars

Watchers

Forks

Packages

No packages published

Languages

  • JavaScript 95.5%
  • HTML 3.2%
  • Dockerfile 1.3%