Le cluster layout - pdf

Terms

4	layout
4	pdf
6	scientific
34	documents
11	content

Associations

Freq.	Weight	Association
2	0.500	layout - pdf
2	0.408	pdf - scientific
3	0.257	documents - pdf
3	0.155	content - documents

Documents par ordre de pertinence

000464 (2004)	Hui Chao [États-Unis] ; Jian Fan [États-Unis]	Layout and Content Extraction for PDF Documents
000054 (2012)	Cartic Ramakrishnan [États-Unis] ; Abhishek Patnia [États-Unis] ; Eduard Hovy [États-Unis] ; Gully Apc Burns [États-Unis]	Layout-aware text extraction from full-text PDF of scientific articles
000150 (2010)	Jöran Beel [Allemagne, États-Unis] ; Bela Gipp [Allemagne, États-Unis] ; Ammar Shaker [Allemagne] ; Nick Friedrich [Allemagne]	SciPlore Xtract: Extracting Titles from Scientific PDF Documents by Analyzing Style Information (Font Size)
000092 (2011)	Ying Liu [États-Unis] ; Kun Bai ; Liangcai Gao [République populaire de Chine]	An Efficient Pre-processing Method to Identify Logical Components from PDF Documents
000319 (2007)	Michael S. Brown [Singapour] ; MINGXUAN SUN [États-Unis] ; RUIGANG YANG [États-Unis] ; LIN YUN [États-Unis] ; W. Brent Seales [États-Unis]	Restoring 2D content from distorted documents
000522 (2003)	RONG JIN [États-Unis] ; CHENGXIANG ZHAI [États-Unis] ; Alex G. Hauptmann [États-Unis]	Information retrieval for OCR documents: A content-based probabilistic correction model
000051 (2012)	Lakshmi Manohar Akella [États-Unis] ; Catherine N. Norton [États-Unis] ; Holly Miller [États-Unis]	NetiNeti: discovery of scientific names from text using machine learning methods
000052 (2012)	Reed S. Beaman [États-Unis] ; Nico Cellinese [États-Unis]	Mass digitization of scientific collections: New opportunities to transform the use of biological specimens and underwrite biodiversity science
000079 (2011)	Stacey J. Anderson [États-Unis] ; Phyra M. Mccandless [États-Unis] ; Kim Klausner [États-Unis] ; Rachel Taketa [États-Unis] ; Valerie B. Yerger [États-Unis]	Tobacco documents research methodology
000107 (2011)	Thomas Steiner [Espagne, États-Unis]	DC Proposal: Enriching Unstructured Media Content about Events to Enable Semi-automated Summaries, Compilations, and Improved Search by Leveraging Social Networks
000125 (2011)	Leslie Sears [États-Unis] ; Ray Hashemi [États-Unis] ; Mark Smith [États-Unis]	Optical Character Recognition of Non-flat Small Documents Using Android: A Case Study
000133 (2011)	Elisa H. Barney Smith [États-Unis] ; Jérôme Darbon [France] ; Laurence Likforman-Sulem [France]	A Mask-based enhancement method for historical documents
000169 (2010)	M. Oliveira [Brésil] ; D. Lins [Brésil] ; Gabriel Torreão [Brésil] ; Jian Fan [États-Unis] ; Marcelo Thielo [Brésil]	A New Method for Text-Line Segmentation for Warped Documents
000187 (2009)	Anurag Bhardwaj [États-Unis] ; Srirangaraj Setlur [États-Unis] ; Venugopal Govindaraju [États-Unis]	Keyword Spotting Techniques for Sanskrit Documents
000204 (2009)	Qingzhao Tan [États-Unis] ; Prasenjit Mitra [États-Unis] ; Lee Giles [États-Unis]	Effectively Searching Maps in Web Documents
000208 (2009)	Guido Sautter [Allemagne] ; Klemens Böhm [Allemagne] ; Donat Agosti [États-Unis] ; Christiana Klingenberg	Creating Digital Resources from Legacy Documents: An Experience Report from the Biosystematics Domain
000251 (2008)	Guangyu Zhu [États-Unis] ; Xiaodong Yu [États-Unis] ; Yi Li [États-Unis] ; David Doermann [États-Unis]	Learning Visual Shape Lexicon for Document Image Content Recognition
000255 (2008)	Carolyn L. Piazza [États-Unis] ; Cynthia Wallat [États-Unis]	Exploring multicultural discourse in information technology documents
000280 (2008)	Anurag Bhardwaj [États-Unis] ; Suryaprakash Kompalli [États-Unis] ; Srirangaraj Setlur [États-Unis] ; Venugopal Govindaraju [États-Unis]	An OCR Based Approach for Word Spotting in Devanagari Documents
000314 (2007)	R. Kandan [Inde] ; Kumar Reddy [Inde] ; R. Arvind [Inde, États-Unis] ; G. Ramakrishnan [Inde]	A Robust Two Level Classification Algorithm for Text Localization in Documents
000317 (2007)	Kazem Taghva [États-Unis] ; Allen Condit [États-Unis] ; Steve Lumos [États-Unis] ; Julie Borsack [États-Unis] ; Thomas Nartker [États-Unis]	Title Extraction and Generation from OCR'd Documents
000321 (2007)	Maya R. Gupta [États-Unis] ; Nathaniel P. Jacobson [États-Unis] ; Eric K. Garcia [États-Unis]	OCR binarization and image pre-processing for searching historical documents
000327 (2007)	G. Agam [États-Unis] ; S. Argamon [États-Unis] ; O. Frieder [États-Unis] ; D. Grossman [États-Unis] ; D. Lewis [États-Unis]	Content-Based Document Image Retrieval in Complex Document Collections
000358 (2006)	R. Thoma [États-Unis] ; Song Mao [États-Unis] ; Dharitri Misra [États-Unis] ; John Rees [États-Unis]	Design of a Digital Library for Early 20th Century Medico-legal Documents
000377 (2006)	George R. Thoma [États-Unis] ; SONG MAO [États-Unis] ; Dharitri Misra [États-Unis] ; John Rees [États-Unis]	Design of a digital library for early 20th century medico-legal documents
000432 (2005)	Paul Herceg [États-Unis] ; Ben Huyck [États-Unis] ; Chris Johnson [États-Unis] ; Linda Van Guilder [États-Unis] ; Amlan Kundu [États-Unis]	Optimizing OCR accuracy for bi-tonal, noisy scans of degraded Arabic documents
000486 (2004)	XIAOFAN LIN [États-Unis] ; Steven Simske [États-Unis]	Automatic document navigation for digital content re-mastering
000514 (2003)	Hrishikesh Aradhye [États-Unis] ; James Herson [États-Unis] ; Gregory Myers [États-Unis]	Syntax-directed content analysis of videotext: application to a map detection and recognition system
000530 (2002)	M. Breuel [États-Unis]	Two Geometric Algorithms for Layout Analysis
000538 (2002)	Krishnaprasad Thirunarayan [États-Unis] ; Aaron Berkovich [États-Unis] ; Dan Sokol [États-Unis]	Semi-automatic Content Extraction from Specifications
000539 (2002)	Daisuke Nishiwaki [États-Unis] ; Masato Hayashi [Japon] ; Atsushi Sato [États-Unis]	Robust Frame Extraction and Removal for Processing Form Documents
000545 (2002)	Jian Liang [États-Unis] ; David Doermann [États-Unis]	Logical Labeling of Document Images Using Layout Graph Matching with Adaptive Learning
000546 (2002)	Daniel Lopresti [États-Unis] ; George Nagy (informaticien) [États-Unis]	Issues in Ground-Truthing Graphic Documents
000549 (2002)	Kazem Taghva [États-Unis] ; Jeffrey Coombs [États-Unis]	Hairetes: A Search Engine for OCR Documents
000564 (2002)	Yalin Wang [États-Unis] ; T. Phillips [États-Unis] ; M. Haralick [États-Unis]	A Study on the Document Zone Content Classification Problem
000589 (2001)	Moti Schneider [Israël] ; Horst Bunke [Suisse] ; Abraham Kandel [États-Unis]	Using fuzzy logic to match strings in documents
000590 (2001)	Marshall Bern [États-Unis] ; Jeff Breidenbach [États-Unis] ; David Goldberg [États-Unis]	Trustworthy Paper Documents
000616 (2001)	Gordon W. Braudaway [États-Unis] ; Fred Mintzer [États-Unis] ; John M. Socolofsky [Royaume-Uni] ; Charles Tresser [États-Unis] ; CHAI WAH WU [États-Unis]	Application of invisible image watermarks to produce remotely printed, duplication resistant, and demonstrably authentic documents
000701 (1999)	R. Manmatha [États-Unis] ; Nitin Srimal [États-Unis]	Scale Space Technique for Word Segmentation in Handwritten Documents
000703 (1999)	E. Kia [États-Unis] ; J. Sauvola [Finlande] ; S. Doermann [États-Unis]	Network-Diffused Media Scaling for Multimedia Content Services
000708 (1999)	Steve Crest [États-Unis]	Electronic documents
000730 (1999)	T. Kanungo [États-Unis] ; R. M. Haralick	Automatic closed-loop methodology for generating character groundtruth for scanned documents
000797 (1998)	J. Wnek [États-Unis] ; R. Price [États-Unis]	Automated conversion of structured documents into SGML
000857 (1997)	Hsinchun Chen [États-Unis] ; Tobun D. Ng [États-Unis] ; Joanne Martinez [États-Unis] ; Bruce R. Schatz [États-Unis]	A concept space approach to addressing the vocabulary problem in scientific information retrieval: An experiment on the Worm Community System
000919 (1996)	Surekha Chandran [États-Unis] ; Sanjay Balasubramanian [États-Unis] ; Tarak Gandhi [États-Unis] ; Arathi Prasad [États-Unis] ; Rangachar Kasturi [États-Unis] ; Atul Chhabra [États-Unis]	Structure recognition and information extraction from tabular documents
000960 (1996)	Venugopal Govindaraju [États-Unis] ; S. N. Srihari [États-Unis]	Assessment of image quality to predict readability of documents
000A15 (1995)	E. Stackpole [États-Unis] ; D. Atkinson [États-Unis] ; John Yokley [États-Unis]	Developing the scientific-technical Digital Library at a National Laboratory
000A32 (1995)	J. Duanfeng He [États-Unis] ; CHUNG-CHI JIM LI [États-Unis] ; SUNDEEP KUMAR [États-Unis] ; J. Katz [États-Unis]	Performance analysis of 2D-barcode-enhanced documents
000A48 (1995)	CHI FANG [États-Unis] ; J. J. Hull	A modified character-level deciphering algorithm for OCR in degraded documents

This area was generated with Dilib version V0.6.32.
Data generation: Sat Nov 11 16:53:45 2017. Site generation: Mon Mar 11 23:15:16 2024

	Serveur d'exploration sur l'OCR
	Attention, ce site est en cours de développement ! Attention, site généré par des moyens informatiques à partir de corpus bruts. Les informations ne sont donc pas validées.

Serveur d'exploration sur l'OCR

Le cluster layout - pdf

Terms

Associations