Имеется текстовый файл с оцифрованным словарём. Оба языка используют кириллицу. Можно ли осуществить поиск (например, в текстовом редакторе) только по словам одного языка, игнорируя слова другого языка? Возможно ли использовать для этого проверку орфографии? На крайний случай, устроило бы выделение всех (не)правильных слов (согласно проверки орфографии) и их удаление.
Member
Статус: Не в сети Регистрация: 18.02.2010 Фото: 2
Lixorer, не кажется ли вам, что вы хотите ... мягко говоря непонятно чего. Например, слово "дерево" - оно написано по-русски или по-украински? Попробуйте по-человечески на понятном компьютеру языке сформулировать задачу. Опять таки, "оцифрованный словарь" - это ЧТО собственно? Набор JPEG-файлов фотографий страниц бумажной книги-словаря?
Dzirt2005, не кажется. Обычно, в разных языках не много одинаковых слов. В моём случае (русский и кабардинский) это точно так. "Оцифрованный словарь", это текст. Я же писал про текстовый редактор. Задача: найти все слова текста входящие в один из языков (т. е. в список по которому проверяется орфография).
Member
Статус: Не в сети Регистрация: 18.02.2010 Фото: 2
Lixorer писал(а):
Задача: найти все слова текста входящие в один из языков (т. е. в список по которому проверяется орфография).
Тогда в чем проблема? Берете свой словарь, читаете его по одному слову и ищите это слово в "списке по которому проверяется орфография" для всех нужных вам языков. И выводите на экран В случае, когда слово есть в нескольких списках, ну сами придумаете, что вам нужно в этом случае делать.
Member
Статус: Не в сети Регистрация: 18.02.2010 Фото: 2
Lixorer писал(а):
Вы здесь слово 'читать' в прямом смысле употребили?
Да, в прямом. Например, вот так:
Пример чтения в "прямом" смысле
Код:
... /* Функция для чтения одного слова из потока */ bool read_word( std::ifstream& is, std::string& word ) { // проверяем что из потока можно читать if ( !is ) return false; // читаем слово в переменную word ... return true; }
... std::ifstream is( "тут имя файла с вашим словарем" ); std::string word; while (read_word( is, word )) { // ищем прочитанное слово в подготовленных "списках, по которым проверяется орфография" if ( word_in_dictionary1( word ) ) /* нашли в словаре 1 */ ; else if ( word_in_dictionary2( word ) ) /* нашли в словаре 2 */ ; else if ( word_in_dictionary3( word ) ) /* нашли в словаре 3 */ ; } ...
Это естественно сильно упрощенный пример "прямого" пословного чтения данных из файла с поиском его в подготовленных словарях. Добавить обработку ошибок, реализовать саму подготовку словарей, ввод данных от пользователя (хотя имя файла с данными), решить и реализовать что именно нужно в местах /* нашли в словаре X */, ну и все. Получили то, что лично вам нужно.
Спасибо, теперь понял. Но, осталась одна проблемка - программирование для меня чуть менее чем тёмный лес. Не могли бы вы хотя бы намекнуть какой язык использован в примере и какие инструменты (программы) подойдут для реализации подобного примера. Заранее благодарен.
Member
Статус: Не в сети Регистрация: 18.02.2010 Фото: 2
Lixorer писал(а):
какой язык использован в примере
Псевдоязык на основе С++
Lixorer писал(а):
и какие инструменты (программы) подойдут для реализации подобного примера
Любые, которые могут работать с файлами
Lixorer писал(а):
программирование для меня чуть менее чем тёмный лес.
Вам придется нанять программиста, чтобы выполнить вашу задачу. Готовьтесь к тому, что найденный вами программист задаст вам те же самые вопросы, что и я задал.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 24
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения