Разделение слов из разных языков в текстовом документе

Overclockers.ru

Конференция

FAQ по конференции

Текущее время: 19.04.2024 9:50

Сообщения без ответов | Активные темы

Список форумов » Общекомпьютерные форумы » Программное обеспечение

Часовой пояс: UTC + 3 часа

Модератор: 4e_alex

Новая тема /

Ответить

Сообщений: 8

	Пред. тема \| След. тема
В случае проблем с отображением форума, отключите блокировщик рекламы

Автор

Сообщение

Lixorer

Добавлено: 18.02.2015 21:02

[профиль]

Member
Статус: Не в сети
Регистрация: 13.10.2006

Имеется текстовый файл с оцифрованным словарём. Оба языка используют кириллицу. Можно ли осуществить поиск (например, в текстовом редакторе) только по словам одного языка, игнорируя слова другого языка?
Возможно ли использовать для этого проверку орфографии? На крайний случай, устроило бы выделение всех (не)правильных слов (согласно проверки орфографии) и их удаление.

Реклама
Партнер

Dzirt2005

Добавлено: 18.02.2015 21:39

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 18.02.2010
Фото: 2

Lixorer, не кажется ли вам, что вы хотите ... мягко говоря непонятно чего. Например, слово "дерево" - оно написано по-русски или по-украински? Попробуйте по-человечески на понятном компьютеру языке сформулировать задачу. Опять таки, "оцифрованный словарь" - это ЧТО собственно? Набор JPEG-файлов фотографий страниц бумажной книги-словаря?

Lixorer

Добавлено: 18.02.2015 22:38

[профиль]

Member
Статус: Не в сети
Регистрация: 13.10.2006

Dzirt2005, не кажется. Обычно, в разных языках не много одинаковых слов. В моём случае (русский и кабардинский) это точно так.
"Оцифрованный словарь", это текст. Я же писал про текстовый редактор.
Задача: найти все слова текста входящие в один из языков (т. е. в список по которому проверяется орфография).

Dzirt2005

Добавлено: 19.02.2015 10:31

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 18.02.2010
Фото: 2

Lixorer писал(а):

Задача: найти все слова текста входящие в один из языков (т. е. в список по которому проверяется орфография).

Тогда в чем проблема? Берете свой словарь, читаете его по одному слову и ищите это слово в "списке по которому проверяется орфография" для всех нужных вам языков. И выводите на экран

В случае, когда слово есть в нескольких списках, ну сами придумаете, что вам нужно в этом случае делать.

Lixorer

Добавлено: 19.02.2015 23:00

[профиль]

Member
Статус: Не в сети
Регистрация: 13.10.2006

Dzirt2005 писал(а):

Берете свой словарь, читаете его по одному слову и ищите это слово в "списке по которому проверяется орфография" для всех нужных вам языков.

Вы здесь слово 'читать' в прямом смысле употребили? Если да, то это слишком долго.

Dzirt2005

Добавлено: 20.02.2015 10:10

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 18.02.2010
Фото: 2

Lixorer писал(а):

Вы здесь слово 'читать' в прямом смысле употребили?

Да, в прямом. Например, вот так:

Пример чтения в "прямом" смысле

Код:

...
/*
Функция для чтения одного слова из потока
*/
bool read_word( std::ifstream& is, std::string& word )
{
    // проверяем что из потока можно читать
    if ( !is )  return false;
    // читаем слово в переменную word
    ...
    return true;
}

...
    std::ifstream is( "тут имя файла с вашим словарем" );
    std::string word;
    while (read_word( is, word ))
    {
        // ищем прочитанное слово в подготовленных "списках, по которым проверяется орфография"
        if ( word_in_dictionary1( word ) )  /* нашли в словаре 1 */ ;
        else if ( word_in_dictionary2( word ) )  /* нашли в словаре 2 */ ;
        else if ( word_in_dictionary3( word ) )  /* нашли в словаре 3 */ ;
    }
...

Это естественно сильно упрощенный пример "прямого" пословного чтения данных из файла с поиском его в подготовленных словарях. Добавить обработку ошибок, реализовать саму подготовку словарей, ввод данных от пользователя (хотя имя файла с данными), решить и реализовать что именно нужно в местах /* нашли в словаре X */, ну и все. Получили то, что лично вам нужно.

Lixorer

Добавлено: 22.02.2015 8:24

[профиль]

Member
Статус: Не в сети
Регистрация: 13.10.2006

Спасибо, теперь понял. Но, осталась одна проблемка - программирование для меня чуть менее чем тёмный лес. Не могли бы вы хотя бы намекнуть какой язык использован в примере и какие инструменты (программы) подойдут для реализации подобного примера. Заранее благодарен.

Dzirt2005

Добавлено: 22.02.2015 10:26

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 18.02.2010
Фото: 2

Lixorer писал(а):

какой язык использован в примере

Псевдоязык на основе С++

Lixorer писал(а):

и какие инструменты (программы) подойдут для реализации подобного примера

Любые, которые могут работать с файлами

Lixorer писал(а):

программирование для меня чуть менее чем тёмный лес.

Вам придется нанять программиста, чтобы выполнить вашу задачу. Готовьтесь к тому, что найденный вами программист задаст вам те же самые вопросы, что и я задал.

Новая тема /

Ответить

Сообщений: 8

Список форумов » Общекомпьютерные форумы » Программное обеспечение

Часовой пояс: UTC + 3 часа

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 24

Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:

Разделение слов из разных языков в текстовом документе

Кто сейчас на конференции

Лаборатория

Обзор ноутбука ASUS Zenbook DUO (UX8406)

Обзор и тестирование модульного блока питания MSI MAG A850GL PCIE5

Обзор и тестирование процессорного кулера APNX AP1-V

Обзор и тестирование материнской платы MSI Z790 Gaming Plus WIFI

Обзор и тестирование смартфона Honor X9b 5G

Новости