La versión 2 ya está disponible y en desarrollo en la rama maestra, lea una historia sobre v2: Why I refactor tesseract.js v2?
Comprobar el soporte / 1.x rama para la versión 1
Tesseract.js es una librería de javascript que introduce palabras en almost any language de las imágenes. (Demo)
Reconocimiento de imágenes
Video Reconocimiento en tiempo real
Tesseract.js envuelve un emscripten port del Tesseract OCR Motor. Funciona en el navegador usando webpack o etiquetas de escritura simple con un CDN y en el servidor con Node.js. Después de ti install it, Usarlo es tan simple como:
import Tesseract from 'tesseract.js';
Tesseract.recognize(
'https://tesseract.projectnaptha.com/img/eng_bw.png',
'eng',
{ logger: m => console.log(m) }
).then(({ data: { text } }) => {
console.log(text);
})
O más imperativo
import { createWorker } from 'tesseract.js';
const worker = createWorker({
logger: m => console.log(m)
});
(async () => {
await worker.load();
await worker.loadLanguage('eng');
await worker.initialize('eng');
const { data: { text } } = await worker.recognize('https://tesseract.projectnaptha.com/img/eng_bw.png');
console.log(text);
await worker.terminate();
})();
Check out the docs para una explicación completa de la API.
- Actualizar a tesseract v4.1 (usando emscripten 1.38.45)
- Soporta varios idiomas al mismo tiempo, por ejemplo: eng+chi_tra para el inglés y el chino tradicional
- Formatos de imagen soportados: png, jpg, bmp, pbm
- Soportar WebAssembly (volver a ASM.js cuando el navegador no lo soporte)
- Tipografía de apoyo
Tesseract.js funciona con una etiqueta <script>
a través de una copia local o CDN, con un webpack a través de npm
y en Node.js con npm/yarn
.
<!-- v2 -->
<script src='https://unpkg.com/tesseract.js@v2.0.2/dist/tesseract.min.js'></script>
<!-- v1 -->
<script src='https://unpkg.com/tesseract.js@1.0.19/src/index.js'></script>
Después de incluir el guión la variable Tesseract
estará disponible globalmente.
Tesseract.js actualmente requiere Node.js v6.8.0 o superior
# For v2
npm install tesseract.js
yarn add tesseract.js
# For v1
npm install tesseract.js@1
yarn add tesseract.js@1
- Versión Fuera de línea: https://github.com/jeromewu/tesseract.js-offline
- Versión Electron: https://github.com/jeromewu/tesseract.js-electron
- Data Entrenada Personalizada: https://github.com/jeromewu/tesseract.js-custom-traineddata
- Chrome Extensión: https://github.com/jeromewu/tesseract.js-chrome-extension
- Con Vue: https://github.com/jeromewu/tesseract.js-vue-app
- Con Angular: https://github.com/jeromewu/tesseract.js-angular-app
- Con React: https://github.com/jeromewu/tesseract.js-react-app
- Typescript: https://github.com/jeromewu/tesseract.js-typescript
- Video Real-time Recognition: https://github.com/jeromewu/tesseract.js-video
Para ejecutar una copia de desarrollo de Tesseract.js haga lo siguiente:
# Primero clonamos el depósito
git clone https://github.com/naptha/tesseract.js.git
cd tesseract.js
# Luego instalamos las dependencias
npm install
# Y finalmente iniciamos el servidor de desarrollo
npm start
El servidor de desarrollo estará disponible en http://localhost:3000/examples/browser/demo.html en su navegador favorito.
Reconstruirá automáticamente tesseract.dev.js
y worker.dev.js
cuando cambie los archivos en la carpeta src..
Puedes usar Gitpod (un código VS online gratuito como el IDE) para contribuir. Con un solo clic se lanzará un espacio de trabajo listo para codificar con los scripts de construcción y arranque ya en proceso y en unos pocos segundos hará girar el servidor de desarrollo para que puedas empezar a contribuir de inmediato sin perder tiempo.
Para construir los archivos estáticos compilados, simplemente ejecute lo siguiente:
npm run build
Esto hará que los archivos salgan en el directorio `dist'.
Este proyecto existe gracias a todas las personas que contribuyen. [Contribuir].
Conviértase en un contribuyente financiero y ayúdenos a mantener nuestra comunidad. [Contribuya]
Apoye este proyecto con su organización. Su logo aparecerá aquí con un enlace a su sitio web. [Contribuir]