Универсальные форматы для представления текста и документов
Содержание:
.TXT вариант
TXT-файл является стандартным текстовым документом, который содержит неформатированный текст. Он распознается любым текстовым редактором или программой обработки текстов, а также может обрабатываться большинством других программ.
Больше информации
Файл TXT открыт в Microsoft Notepad
Файлы TXT полезны для хранения информации в виде простого текста без специального форматирования помимо основных шрифтов и шрифтов стили. Файл обычно используется для записи заметок, указаний и других подобных документов, которые не обязательно должны отображаться определенным образом. Если вы хотите создать документ с большим количеством возможностей форматирования, например, отчета, информационного бюллетеня или резюме, вы должны посмотреть на файл .DOCX , который используется популярной программой Microsoft Word.
Если у вас компьютер под управлением Windows, Notepad и Wordpad поставляются в комплекте с операционной системой (ОС) и позволяют создавать и редактировать файлы TXT. Если у вас компьютер под управлением macOS (OS X), TextEdit поставляется в комплекте с ОС и является хорошим выбором для создания и редактирования файлов TXT. ПРИМЕЧАНИЕ. Различные аппаратные устройства, такие как смартфоны и Amazon Kindle , а также веб-браузеры, такие как Chrome и Firefox, также распознают текстовые файлы.
Common TXT Filenames
Новый текст Document.txt — имя файла по умолчанию Microsoft Windows предоставляет новые текстовые документы, созданные через контекстное меню (щелкните правой кнопкой мыши на рабочем столе и выберите «Новый → текстовый документ»).
README .txt — текстовый файл, обычно включаемый в программу установки программного обеспечения, которая предоставляет информацию о программном обеспечении. Пользователи должны часто читать этот файл перед использованием программного обеспечения.
Программы которые открывают TXT файлы
|
|
|
|
|
Текстовые файлы, документы
a. DOC или DOCX
– текстовый документ, который создаётся при помощи Microsoft Word. Данные документы кроме текста могут также содержать графику, картинки, диаграммы и таблицы.
b. RTF (Rich Text Format)
Данный формат текстовых документов, как правило, поддерживают все текстовые редакторы. Формат является практически универсальным, так как помогает экспортировать или импортировать текстовые данные между программами. Данный формат создаётся автоматически в программе WordPad.
c. TXT
является стандартным форматом текстового документа, в котором текст сохраняется без какого-либо форматирования. Программа «Блокнот» создаёт документы с данным расширением.
d. PDF (Portable Document Format)
расширение документов Adobe Acrobat. Такие документы в независимости от устройств, настроек, формы и формата имеют фиксированную форму. Формат документа полезен при необходимости сохранить определённую структуру документа.
Сканирование текста. Cистемы оптического распознавания текста ocr
Современные
программно-аппаратные системы позволяют
автоматизировать ввод больших объемов
печатной информации в компьютер,
используя, сканер и распознавание
текстов.
Сначала
печатная страница сканируется, в
результате получается растровое
изображение (картинка). Растровое
изображение страницы может быть получено
и через факс-модем, сканер, цифровую
фотокамеру или другое устройство.
Работать с изображением как с текстом,
т.е. редактировать, форматировать и пр.,
естественно, нельзя. Поэтому, необходимо
использовать программу оптического
распознавания текста (OCR — Optical
Character Recognition) для получения полноценного
текстового документа.
На
первом этапе OCR разбивает страницу на
блоки текста, основываясь на особенностях
правого и левого выравнивания и наличия
нескольких колонок. Затем распознанный
блок разбивается на строки. Потом строки
разбиваются на непрерывные области
изображения (отдельные буквы). Алгоритм
распознавания каждую область изображения
соотносит с наиболее близким по начертанию
символом. В результате растровое
изображение текстовой страницы
восстанавливается в символах текста.
OCR-системы
могут достигать наилучшей точности
распознавания — свыше 99,9 % для
чистых изображений, составленных из
обычных шрифтов. Но полностью избежать
ошибок не удается. Процент ошибок
распознавания для «нечистых» текстов
намного выше.
Основное
назначение OCR-систем состоит в анализе
растровой информации (отсканированного
символа) и присвоении фрагменту
изображения соответствующего символа.
После завершения процесса распознавания
OCR-системы должны уметь сохранять
форматирование исходных документов,
присваивать в нужном месте атрибут
абзаца, сохранять таблицы, графику
и т. д. Современные программы
распознавания поддерживают все известные
текстовые и графические форматы и
форматы электронных таблиц, а некоторые
поддерживают такие форматы, как HTML и
PDF.
При
распознавании текстов, в которых
использовано несколько языков,
эффективность распознавания зависит
от умения OCR-системы формировать группы
языков. В то же время в некоторых
системах уже имеются комбинации для
наиболее часто используемых языков,
например: русский и английский.
На
данный момент существует огромное
количество программ, поддерживающих
распознавание текста как одну из
возможностей.
Лидер
в этой области — FineReader. Это программный
продукт фирмы ABBYY Software, раньше разрабатывался
фирмой Bit Software. FineReader поддерживает
большое количество форматов для
сохранения, включая PDF, имеет возможность
прямого распознавания из PDF-файлов.
Новая технология Intelligent Background Filtering
(интеллектуальной фильтрации фона)
позволяет отсеять информацию о текстуре
документа и фоновом шуме
изображения. FineReader точно
воспроизводит документы сложной верстки.
OCR
CuneiForm — один из главных конкурентов
FineReader. Производителем является российский
разработчик программного обеспечения
Cognitive Technologies. OCR CuneiForm выгодно отличается
уровнем распознавания, особенно текстов
низкого качества, удобным интерфейсом
с наличием встроенных мастеров —
помощников в работе, встроенным текстовым
редактором, не уступающим по своей
функциональности популярным текстовым
процессорам, и многими другими
возможностями.
OCR
CuneiForm способна распознавать любые
полиграфические и машинописные гарнитуры
всех начертаний и шрифтов, получаемые
с принтеров, за исключением декоративных
и рукописных.
Описание самых распространенных форматов файлов
Ниже приводятся форматы файлов, их краткое описание и какими программами они открываются.
Графические файлы
Расширение файла |
Описание |
Чем открыть |
.gif |
Наиболее распространенный в Интернете графический формат файла. Gif означает (Graphics Interchange Format). |
В операционной системе Windows уже встроен просмотрщик GIF файлов. Просто кликните дважды на имени файла с расширением .gif. Так же можно посоветовать для открытия и редактирования следующие программы: CorelDRAW, Photoshop. |
.jpg и .jpeg |
Текущий стандарт сжатия используется для фотографий и статичных изображений. |
Программы Adobe Photoshop CS6, Corel PaintShop Pro X4, Roxio Creator 2012 |
.tiff |
TIFF (Tagged Image File Format) — формат растрового изображения с очень высоким разрешением. |
Большинство графических редакторов способны открыть файл с расширением .tiff. К примеру, Photoshop, GIMP. |
Звуковые файлы
Расширение файла |
Описание |
Чем открыть |
.mp3 | Файл MP3 – самый распространенный формат для потоковой передачи музыки с качеством CD. Приблизительно одна минута музыки по объему равняется 1 МБ | Для воспроизведения необходим MP3 файла необходим плеер, например, AIMP3 |
.wav | Наиболее распространенный звуковой формат. Это собственный аудио формат операционной системы Windows. данный формат характеризуется высоким качеством воспроизведения, поскольку он не сжат. | Воспроизвести можно при помощи встроенного проигрывателя, либо программой WindowsPlayer. Для конвертации wav в mp3 можно использовать программу Movavi Video Converter |
.ra | Фирменное название формата — RealAudio. Данный формат разработан компанией RealNetworks. RealAudio позволяет воспроизводить звуки в реальном времени. | Этот тип файла требует плеер Real Player, который доступен как для Macintosh, и для Windows. |
Видео файлы
Расширение файла |
Описание |
Чем открыть |
.avi | AVI (Audio Video Interleave) — формат предназначен для формирования как аудио, так и видео данных. Аудио и видео данные могут быть обработаны с помощью любого кодека. | Для воспроизведения файла avi можно воспользоваться программой DivX Player или KMPlayer. |
.mov и .movie | Воспроизведение потокового видео |
Необходимая программа — QuickTime Player |
.mpg и .mpeg | Это формат сжатого видео высокого качества. |
Программы открывающие .mpg и .mpeg — Winamp Media Playe, DivX Player, Splash Lite. |
Файлы документов
Расширение файла |
Описание |
Чем открыть |
.doc | Формат отформатированного документа системы Windows (тип файла ASCII). Так же зачастую расширение .doc имеют файлы программы Word (тип файла Binary). | Программы: для типа файлов ASCII — любой текстовый редактор, для типа файлов Binary — программа Word. |
Формат переносимых документов разработан Adobe Systems. Формат отформатированного документа содержащий текст, рисунки, графики. Обеспечивает одинаковое отображение на всех платформах. | Программы открывающие PDF: PDF-XChange Viewer, PDF-Tools. | |
.txt | Обычный текстовый файл (ASCII). | Эти файлы можно просматривать с помощью текстового процессора, такие как Microsoft Word или простой текстовый редактор |
Файлы архиваторов
Расширение файла |
Описание |
Чем открыть |
.rar | Файл архива. Позволяет собрать и сжать разные файлы в один с целью облегчения передачи по интернету. | Наиболее популярная программа для работы с RAR архивом — WinRAR |
.zip | Файл архива для DOS и Windows. Позволяет производить сжатие данных. |
Для архивации файлов можно использовать: 7-Zip, WinZIP. |
.tar | Файл архива. Данный формат файла обычно не сжимает данные, а просто архивирует. |
Программы открывающие .tar — WinZIP, 7-Zip. |
Резюме файла TXT
У нас есть восемь существующие программные обеспечения, связанные с файлами TXT (как правило это программное обеспечение от Microsoft Corporation, известное как Microsoft Notepad), и их можно отнести к категории основных типов файлов один. Традиционно эти файлы имеют формат Plain Text File .
В большинстве случаев эти файлы относятся к Text Files.
Расширение файла TXT поддерживается Windows, Mac и Linux. Данные типы файлов можно найти в основном на настольных компьютерах и некоторых мобильных устройствах.
Рейтинг популярности файлов TXT составляет «Низкий». Это означает, что они не часто встречаются на большинстве устройств.