Анализ существующих приложений и систем

Для сравнения хранилищ приложений и систем выделены следующие характеристики:

  • 1. Предъявляют ограничение по памяти для хранения корпусов текстов.
  • 2. Поддерживают различные типы форматов.
  • 3. Предоставляют возможность сохранение полученных результатов.
  • 4. Имеют встроенные корпуса текстов.
  • 5. Являются общедоступными.
  • 6. Разграничивают функциональные возможности по ролям.
  • 7. Имеют интерфейсы прикладного уровня.
  • 8. Позволяют сохранять динамические атрибуты.

Приложение «AntConc»

Приложение «AntConc» является настольным, межплатформенным, бесплатным, не требующим установки программным обеспечением, которое ориентировано на многоцелевой анализ корпусов текстов.

Приложение «AntConc» позволяет загружать тексты документов в различных форматах, таких как «txt», «html», «htm», «xml» и «ant». К сожалению, документы в других форматах программа прочитать не может, т.к. не имеет фильтров, которые позволяли бы ей преобразовывать один формат документа в другой формат. Приложение может работать с аннотированными документами в форматах «xml» и «html», однако при аннотировании таких файлов не существует возможности использовать внутренние теги или информацию, которая храниться в свойствах тегов, в данных случаях приложение просто читает текстовые данные, которые хранятся между тегами.

Предварительно файлы необходимо сохранить на внешний или внутренний носитель, к сожалению, внешние или внутренние носители не являются безграничными. Загруженные файлы и результаты программа хранит в оперативной памяти, что не является хорошим решением, т.к. оперативная память является ограниченным ресурсом, следовательно, гигантские корпуса текстов не могут быть обработаны на стандартном персональном компьютере.

При открытии новых документов приложение создает список слов с частотой их употребления в текстах и сохраняет результаты в оперативную память. Если добавить новые документы, то приложение очищает предыдущие результаты и генерирует новые, что занимает дополнительное время. Приложение не имеет встроенных корпусов текстов, над которыми можно было бы поработать лингвисту, чтобы потренировать и изучить весь возможный функционал.

Приложение позволяет произвести кластеризацию слов, данная функция получает на вход слово и ищет группы слов, которые связаны с этим словом, разбивает их на группы и показывает частотность каждой группы. Полученные файлы можно отобразить на дисплей, что позволяет пользователям убедиться, что загружены необходимые документы. Пользователь может отыскивать слова, словосочетания в текстах с учетом и без учета регистра, также пользователь может написать регулярное выражение для поиска определенного набора слов, словосочетаний или предложений.

Приложение отобразит полученный результат на дисплей пользователя в стандартном графическом представлении. Приложение позволяет сохранить результаты в файле в формате «txt». В приложении не предусмотрены роли, поэтому данное приложение не разграничивает функциональные возможности по ролям. Приложение не имеет интерфейсов прикладного уровня и не может сохранять динамически добавляемые атрибуты.

Вывод: приложение «AntConc» является хорошим настольным приложением для исследования небольших, узкоспециализированных корпусов текстов, к сожалению, такая программа не подходит для исследования больших корпусов текстов, которые включают в себя тысячи текстов.

 
< Пред   СОДЕРЖАНИЕ   Загрузить   След >