Serveur d'exploration sur l'OCR

Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.

Le cluster layout - pdf

Terms

4layout
4pdf
6scientific
34documents
11content

Associations

Freq.WeightAssociation
20.500layout - pdf
20.408pdf - scientific
30.257documents - pdf
30.155content - documents

Documents par ordre de pertinence
000464 (2004) Hui Chao [États-Unis] ; Jian Fan [États-Unis]Layout and Content Extraction for PDF Documents
000054 (2012) Cartic Ramakrishnan [États-Unis] ; Abhishek Patnia [États-Unis] ; Eduard Hovy [États-Unis] ; Gully Apc Burns [États-Unis]Layout-aware text extraction from full-text PDF of scientific articles
000150 (2010) Jöran Beel [Allemagne, États-Unis] ; Bela Gipp [Allemagne, États-Unis] ; Ammar Shaker [Allemagne] ; Nick Friedrich [Allemagne]SciPlore Xtract: Extracting Titles from Scientific PDF Documents by Analyzing Style Information (Font Size)
000092 (2011) Ying Liu [États-Unis] ; Kun Bai ; Liangcai Gao [République populaire de Chine]An Efficient Pre-processing Method to Identify Logical Components from PDF Documents
000319 (2007) Michael S. Brown [Singapour] ; MINGXUAN SUN [États-Unis] ; RUIGANG YANG [États-Unis] ; LIN YUN [États-Unis] ; W. Brent Seales [États-Unis]Restoring 2D content from distorted documents
000522 (2003) RONG JIN [États-Unis] ; CHENGXIANG ZHAI [États-Unis] ; Alex G. Hauptmann [États-Unis]Information retrieval for OCR documents: A content-based probabilistic correction model
000051 (2012) Lakshmi Manohar Akella [États-Unis] ; Catherine N. Norton [États-Unis] ; Holly Miller [États-Unis]NetiNeti: discovery of scientific names from text using machine learning methods
000052 (2012) Reed S. Beaman [États-Unis] ; Nico Cellinese [États-Unis]Mass digitization of scientific collections: New opportunities to transform the use of biological specimens and underwrite biodiversity science
000079 (2011) Stacey J. Anderson [États-Unis] ; Phyra M. Mccandless [États-Unis] ; Kim Klausner [États-Unis] ; Rachel Taketa [États-Unis] ; Valerie B. Yerger [États-Unis]Tobacco documents research methodology
000107 (2011) Thomas Steiner [Espagne, États-Unis]DC Proposal: Enriching Unstructured Media Content about Events to Enable Semi-automated Summaries, Compilations, and Improved Search by Leveraging Social Networks
000125 (2011) Leslie Sears [États-Unis] ; Ray Hashemi [États-Unis] ; Mark Smith [États-Unis]Optical Character Recognition of Non-flat Small Documents Using Android: A Case Study
000133 (2011) Elisa H. Barney Smith [États-Unis] ; Jérôme Darbon [France] ; Laurence Likforman-Sulem [France]A Mask-based enhancement method for historical documents
000169 (2010) M. Oliveira [Brésil] ; D. Lins [Brésil] ; Gabriel Torreão [Brésil] ; Jian Fan [États-Unis] ; Marcelo Thielo [Brésil]A New Method for Text-Line Segmentation for Warped Documents
000187 (2009) Anurag Bhardwaj [États-Unis] ; Srirangaraj Setlur [États-Unis] ; Venugopal Govindaraju [États-Unis]Keyword Spotting Techniques for Sanskrit Documents
000204 (2009) Qingzhao Tan [États-Unis] ; Prasenjit Mitra [États-Unis] ; Lee Giles [États-Unis]Effectively Searching Maps in Web Documents
000208 (2009) Guido Sautter [Allemagne] ; Klemens Böhm [Allemagne] ; Donat Agosti [États-Unis] ; Christiana KlingenbergCreating Digital Resources from Legacy Documents: An Experience Report from the Biosystematics Domain
000251 (2008) Guangyu Zhu [États-Unis] ; Xiaodong Yu [États-Unis] ; Yi Li [États-Unis] ; David Doermann [États-Unis]Learning Visual Shape Lexicon for Document Image Content Recognition
000255 (2008) Carolyn L. Piazza [États-Unis] ; Cynthia Wallat [États-Unis]Exploring multicultural discourse in information technology documents
000280 (2008) Anurag Bhardwaj [États-Unis] ; Suryaprakash Kompalli [États-Unis] ; Srirangaraj Setlur [États-Unis] ; Venugopal Govindaraju [États-Unis]An OCR Based Approach for Word Spotting in Devanagari Documents
000314 (2007) R. Kandan [Inde] ; Kumar Reddy [Inde] ; R. Arvind [Inde, États-Unis] ; G. Ramakrishnan [Inde]A Robust Two Level Classification Algorithm for Text Localization in Documents
000317 (2007) Kazem Taghva [États-Unis] ; Allen Condit [États-Unis] ; Steve Lumos [États-Unis] ; Julie Borsack [États-Unis] ; Thomas Nartker [États-Unis]Title Extraction and Generation from OCR'd Documents
000321 (2007) Maya R. Gupta [États-Unis] ; Nathaniel P. Jacobson [États-Unis] ; Eric K. Garcia [États-Unis]OCR binarization and image pre-processing for searching historical documents
000327 (2007) G. Agam [États-Unis] ; S. Argamon [États-Unis] ; O. Frieder [États-Unis] ; D. Grossman [États-Unis] ; D. Lewis [États-Unis]Content-Based Document Image Retrieval in Complex Document Collections
000358 (2006) R. Thoma [États-Unis] ; Song Mao [États-Unis] ; Dharitri Misra [États-Unis] ; John Rees [États-Unis]Design of a Digital Library for Early 20th Century Medico-legal Documents
000377 (2006) George R. Thoma [États-Unis] ; SONG MAO [États-Unis] ; Dharitri Misra [États-Unis] ; John Rees [États-Unis]Design of a digital library for early 20th century medico-legal documents
000432 (2005) Paul Herceg [États-Unis] ; Ben Huyck [États-Unis] ; Chris Johnson [États-Unis] ; Linda Van Guilder [États-Unis] ; Amlan Kundu [États-Unis]Optimizing OCR accuracy for bi-tonal, noisy scans of degraded Arabic documents
000486 (2004) XIAOFAN LIN [États-Unis] ; Steven Simske [États-Unis]Automatic document navigation for digital content re-mastering
000514 (2003) Hrishikesh Aradhye [États-Unis] ; James Herson [États-Unis] ; Gregory Myers [États-Unis]Syntax-directed content analysis of videotext: application to a map detection and recognition system
000530 (2002) M. Breuel [États-Unis]Two Geometric Algorithms for Layout Analysis
000538 (2002) Krishnaprasad Thirunarayan [États-Unis] ; Aaron Berkovich [États-Unis] ; Dan Sokol [États-Unis]Semi-automatic Content Extraction from Specifications
000539 (2002) Daisuke Nishiwaki [États-Unis] ; Masato Hayashi [Japon] ; Atsushi Sato [États-Unis]Robust Frame Extraction and Removal for Processing Form Documents
000545 (2002) Jian Liang [États-Unis] ; David Doermann [États-Unis]Logical Labeling of Document Images Using Layout Graph Matching with Adaptive Learning
000546 (2002) Daniel Lopresti [États-Unis] ; George Nagy (informaticien) [États-Unis]Issues in Ground-Truthing Graphic Documents
000549 (2002) Kazem Taghva [États-Unis] ; Jeffrey Coombs [États-Unis]Hairetes: A Search Engine for OCR Documents
000564 (2002) Yalin Wang [États-Unis] ; T. Phillips [États-Unis] ; M. Haralick [États-Unis]A Study on the Document Zone Content Classification Problem
000589 (2001) Moti Schneider [Israël] ; Horst Bunke [Suisse] ; Abraham Kandel [États-Unis]Using fuzzy logic to match strings in documents
000590 (2001) Marshall Bern [États-Unis] ; Jeff Breidenbach [États-Unis] ; David Goldberg [États-Unis]Trustworthy Paper Documents
000616 (2001) Gordon W. Braudaway [États-Unis] ; Fred Mintzer [États-Unis] ; John M. Socolofsky [Royaume-Uni] ; Charles Tresser [États-Unis] ; CHAI WAH WU [États-Unis]Application of invisible image watermarks to produce remotely printed, duplication resistant, and demonstrably authentic documents
000701 (1999) R. Manmatha [États-Unis] ; Nitin Srimal [États-Unis]Scale Space Technique for Word Segmentation in Handwritten Documents
000703 (1999) E. Kia [États-Unis] ; J. Sauvola [Finlande] ; S. Doermann [États-Unis]Network-Diffused Media Scaling for Multimedia Content Services
000708 (1999) Steve Crest [États-Unis]Electronic documents
000730 (1999) T. Kanungo [États-Unis] ; R. M. HaralickAutomatic closed-loop methodology for generating character groundtruth for scanned documents
000797 (1998) J. Wnek [États-Unis] ; R. Price [États-Unis]Automated conversion of structured documents into SGML
000857 (1997) Hsinchun Chen [États-Unis] ; Tobun D. Ng [États-Unis] ; Joanne Martinez [États-Unis] ; Bruce R. Schatz [États-Unis]A concept space approach to addressing the vocabulary problem in scientific information retrieval: An experiment on the Worm Community System
000919 (1996) Surekha Chandran [États-Unis] ; Sanjay Balasubramanian [États-Unis] ; Tarak Gandhi [États-Unis] ; Arathi Prasad [États-Unis] ; Rangachar Kasturi [États-Unis] ; Atul Chhabra [États-Unis]Structure recognition and information extraction from tabular documents
000960 (1996) Venugopal Govindaraju [États-Unis] ; S. N. Srihari [États-Unis]Assessment of image quality to predict readability of documents
000A15 (1995) E. Stackpole [États-Unis] ; D. Atkinson [États-Unis] ; John Yokley [États-Unis]Developing the scientific-technical Digital Library at a National Laboratory
000A32 (1995) J. Duanfeng He [États-Unis] ; CHUNG-CHI JIM LI [États-Unis] ; SUNDEEP KUMAR [États-Unis] ; J. Katz [États-Unis]Performance analysis of 2D-barcode-enhanced documents
000A48 (1995) CHI FANG [États-Unis] ; J. J. HullA modified character-level deciphering algorithm for OCR in degraded documents

Wicri

This area was generated with Dilib version V0.6.32.
Data generation: Sat Nov 11 16:53:45 2017. Site generation: Mon Mar 11 23:15:16 2024