Описание метода:
ИзвлечениеТекста.ПолучитьТекст (TextExtraction.GetText)
ИзвлечениеТекста (TextExtraction)
ПолучитьТекст (GetText)
Синтаксис:
ПолучитьТекст()
Возвращаемое значение:
Тип: Строка. Текст, извлеченный из файла, или пустая строка в случае ошибки.
Описание:
Извлекает текст из файла. Тип файла определяется по расширению файла (т.е. текст из файла с расширением .tmp извлечен не будет). Для извлечения текста из файлов используется интерфейс IFilter. Он является расширяемым. Можно установить дополнительные модули, чтобы появилась возможность извлекать текст из еще одного типа файлов. По умолчанию текст извлекается из файлов следующих типов (имеющих расширение): ASCX, ASP, ASPX, CSS, HHC, HTA, HTM, HTML, HHT, HTW, HTX, ODC, STM, DOC, DOT, POT, PPS, PPT, XLB, XLC, XLS, XLT, TXT, EML. Подразумевается, что файлы с расширением TXT - это текстовые файлы в кодировке ANSI или UNICODE (UTF-16).
Примечание:
Следует использовать только в среде Windows NT 4.0, 2000, XP.
Чтобы узнать, какие расширения для IFilter уже установлены на вашем компьютере, можно скачать и установить программу IFilter Explorer (
http://www.citeknet.com).
Пример:
ИмяФайла = "C:/log.txt";
Объект = Новый ИзвлечениеТекста(ИмяФайла);
Текст = Объект.ПолучитьТекст();
Сообщить(Текст);
Собственно вопрос:
кто нибудь в курсе, будет ли метод когда-нибудь будет извлекать текст из файлов DOCX?