|   |   | 
| 
 | Предложите алгоритм для автоматического исправления "слипшихся" и "разряженных" | ☑ | ||
|---|---|---|---|---|
| 0
    
        trdm 20.12.21✎ 12:05 | 
        Предложите алгоритм для автоматического исправления "слипшихся" и "разряженных" слов в тексте.
 Пример текста: "Пр е д л о ж итеалгоритм для авто ма тич еского ис правления "слипшихся" и "разряженных" слов в тексте." Предположим, что словарь слов есть и он содержится в списке значений. Есть и незнакомые словарю слова, что решается дополнительным списком. Остальные слова и "разряженные" и "слипшиеся" соответствуют словарю. Столкнулся с проблемой деления слов на более мелкие :( но правильные. | |||
| 1
    
        trdm 20.12.21✎ 12:07 | 
        Для заполнения словаря использовал словарь "Hunspell" из плагина к Notepad++.
 Язык С++/Qt. | |||
| 2
    
        Kassern 20.12.21✎ 12:07 | 
        (0) это не такая уж тривиальная задача. СтрЗаменить тут не проканает))     | |||
| 3
    
        trdm 20.12.21✎ 12:08 | 
        -Есть и незнакомые словарю слова, что решается дополнительным списком. 
 +Есть и незнакомые словарю слова, что решается дополнительным списком, хотя и со скрипом... | |||
| 4
    
        trdm 20.12.21✎ 12:08 | 
        (2) Знаю.
 Но когда тебе читалка бубнит слипшийся текст, то уши вянут на корню... | |||
| 5
    
        dubolom 20.12.21✎ 12:10 | 
        Выкинуть из текста пробелы.
 Разбить свой словарь на группы слов по длине. Потом начиная с первого символа сравнивать последовательности от 1 буквы и дальше со словарём. И отрезать найденые слова. Возможны неоднозначности, поэтому, если слово не ищется после "отрезания", то возвращаться на прошлую итерацию. В 99% случаев такого хватит. | |||
| 6
    
        серый КТУЛХУ 20.12.21✎ 12:10 | 
        если проблема только с слипшихся - вроде разбивка по словарю должна работать. нэ?     | |||
| 7
    
        trdm 20.12.21✎ 12:10 | 
        QString uTextCorrector::correct(QString &psIn)
 { m_inputStr = psIn, m_outputStr = ""; QString line, vWord, vWordLW, vWordFR, line_part, line_partLC; uStringType vType, vCurrType; int vPartCnt, vPartCntW; QStack<QString> vWordStack; QMap<QString,QString> vWordMapFounds; QMap<QString,QString> vWordMapFoundsLC; QStringList strings_txt = m_inputStr.split('\n'), line_items; kiilTransferLines(strings_txt); int vReplaceCuonter = 0, vLineCounter = 0, vLineAll = strings_txt.size(); m_lisrWidget->clear(); foreach (line, strings_txt) { while (line.indexOf(" ") != -1) { line = line.replace(" "," "); } vLineCounter++; if (vLineCounter % 50 == 0) { vWord = QString::fromUtf8("Обработано строк: %1 из %2").arg(vLineCounter).arg(vLineAll); status(vWord); vWord = ""; } if (vLineCounter == 24) { vLineCounter++; vLineCounter--; } line = line.replace(" "," "); replaceFragments(line, true); // line = line.replace(","," ,"); line = line.replace("."," ."); line = line.replace(":"," :"); //qDebug() << "line: " << vLineCounter << line; top_step: line_items = line.split(" "); vPartCnt = line_items.count(); vReplaceCuonter += replaceLat2Cir(line_items, line); vReplaceCuonter += replaceQuestionWord(line_items, line); if (line_items.size() > 0) { bool vHasRplc = false; for (int il4 = 0; il4 < vPartCnt; ++il4) { vWord = line_items.at(il4); vWordLW = vWord; //vWordLW = vWordLW.toLower(); if (!spell(vWordLW)) { line_partLC = correctWord(vWordLW); if (line_partLC.compare(vWordLW) != 0) { vHasRplc = true; line = line.replace(vWordLW, line_partLC, Qt::CaseInsensitive); } } } if (vHasRplc) { line_items = line.split(" "); vPartCnt = line_items.count(); } } int vCnt2, vCnt3; for (vCnt2 = 0; vCnt2 < vPartCnt; ++vCnt2) { // строки vWord = ""; vPartCntW = 0; vWordFR = ""; if (vWordStack.size() > 0) { //vCnt2 = vCnt3; vWord = vWordStack.pop(); //qDebug() << "Test (vWordStack.pop): " << vWord; if (vWordMapFoundsLC.contains(vWord)) { vWord = vWordMapFoundsLC.value(vWord); } if (vWordMapFounds.contains(vWord)) { vWordFR = vWordMapFounds.value(vWord); line = line.replace(vWordFR, vWord); vReplaceCuonter++; } } vWord = ""; vPartCntW = 0; vWordFR = ""; vCurrType = uUnknown; vWordMapFounds.clear(); vWordMapFoundsLC.clear(); vWordStack.clear(); // << тут ловить самую большую слову.. bool vFound = false; for (vCnt3 = vCnt2; vCnt3 < vPartCnt; ++vCnt3) { // слова. vFound = false; line_part = line_items.at(vCnt3); vType = typeString(line_part); if (!(vType == uCirLetter || vType == uLatLetter)) { if (vType == uLatCirLetter) { line_part.append("(").append(m_lineCir).append(" | ").append(m_lineLat).append(")"); m_lisrWidget->addItem(line_part); } break; } if (vCurrType == uUnknown) { vCurrType = vType; setCurrentLangPack(vType); } else if (vCurrType != vType) { break; } if (line_part.length() > 5) { line_partLC = line_part; if (spell(line_part)) { continue; } line_partLC = line_partLC.toLower(); vWordLW = line_partLC; } vWord.append(line_part); vWordFR.append(line_part).append(" "); vPartCntW++; if (vWord.length() == 1) { continue; } vWordLW = vWord; vWordLW = vWordLW.toLower(); if (spell(vWordLW)) { vCnt2 = vCnt3; vWordStack.push(vWordLW); vWordMapFounds.insert(vWord, vWordFR.trimmed()); vWordMapFoundsLC.insert(vWordLW,vWord); //qDebug() << "Found-2: " << vWord << "vCnt2:" << vCnt2; } } if (vWordStack.size() > 0) { vWord = vWordStack.pop(); if (vWordMapFoundsLC.contains(vWord)) { vWord = vWordMapFoundsLC.value(vWord); } if (vWordMapFounds.contains(vWord)) { vWordFR = vWordMapFounds.value(vWord); line = line.replace(vWordFR, vWord); vReplaceCuonter++; } } } replaceFragments(line, false); // line = line.replace(" ,",","); line = line.replace(" .","."); line = line.replace(" :",":"); m_outputStr.append(line); m_outputStr.append('\n'); } QString vStat = QString::fromUtf8("Replace cuonter: %1").arg(vReplaceCuonter); m_statusLabel->setText(vStat); return m_outputStr; } | |||
| 8
    
        dubolom 20.12.21✎ 12:11 | 
        (7) Стыдно должно быть издеваться над честными 1с-никами бусурманским кодом.     | |||
| 9
    
        Kassern 20.12.21✎ 12:14 | 
        основная проблема понять, смысл текста, например текст "я шел к купил", как понять, что надо "шел" и "к" объединить в шелк?) Оба слова могут существовать раздельно и только контекст заставляет писать их вместе     | |||
| 10
    
        dubolom 20.12.21✎ 12:16 | 
        (9) Это уже без ИИ не решить. Но такого не так много, подобные косяки можно и руками вылавливать потом.     | |||
| 11
    
        trdm 20.12.21✎ 12:16 | 
        (9) Именно. 
 У меня с этим беда на данный момент. | |||
| 12
    
        Злопчинский 20.12.21✎ 12:18 | 
        как вы вообще аудио слушаете... оно ж медленное шо капец. я сколько ни пробовал - не идет...     | |||
| 13
    
        trdm 20.12.21✎ 12:18 | 
        (8) Да код на уровне 3-го класса.     | |||
| 14
    
        trdm 20.12.21✎ 12:19 | 
        (12) В читалках есть настройки типа слов в минуту.
 https://prnt.sc/23oq6zc Подбираешь под свое ухо.. | |||
| 15
    
        polosov 20.12.21✎ 12:20 | 
        if (vLineCounter == 24) {
 vLineCounter++; vLineCounter--; } Это какая-то шутка на С++? | |||
| 16
    
        trdm 20.12.21✎ 12:20 | 
        (15) Ловил отладчиком определенную строку.     | |||
| 17
    
        trdm 20.12.21✎ 12:25 | 
        что пока получается:
 https://prnt.sc/23oqz3n | |||
| 18
    
        trdm 20.12.21✎ 12:27 | 
        проект с++/Qt. https://disk.yandex.ru/d/WX2eAbKshjjMGg
 Настройка "Папка словарей" - названа не корректно, пока там путь к основному словарю, типа: "C:/Users/trdm/AppData/Roaming/Notepad++/plugins/config/Hunspell/ru_RU.dic" | |||
| 19
    
        PLUT гуру 20.12.21✎ 12:29 | 
        - молока купил?
 - молокаку не пил | |||
| 20
    
        polosov 20.12.21✎ 12:29 | 
        (18) Типа твой гений дарит нам? ))     | |||
| 21
    
        trdm 20.12.21✎ 12:29 | 
        Добивает:
 Этотрассказнаписаннаоснованииреальных фактов, нонекоторыеимена, названияместисобытиябыли изменены. >>> Этот рассказ написанна основании реальных фактов, ноне которые имена, названиям ест и события были изменены. | |||
| 22
    
        polosov 20.12.21✎ 12:31 | 
        (21) А ты реально думал, что в 50 строк ты сможешь это решить?     | |||
| 23
    
        trdm 20.12.21✎ 12:39 | 
        (22) я за идеями пришел, а не за утешениями.     | |||
| 24
    
        Злопчинский 20.12.21✎ 12:42 | 
        (23) м.б частотный анализ слов в тексте и допобработка явных выкидышей...?     | |||
| 25
    
        Злопчинский 20.12.21✎ 12:43 | 
        какая гадость этот ваш https://prnt.sc - чего он все время капчу требует...     | |||
| 26
    
        polosov 20.12.21✎ 12:45 | 
        (23) Сейчас модно такие задачи скармливать нейросетям.
 Возьми какую-нибудь открытую нейросеть для текстов. Программно сделай кривые тексты из собрания сочинений Толстого и обучи ее. | |||
| 27
    
        Bigbro 20.12.21✎ 12:45 | 
        я шел к бабе, нес подарок
 я шелк бабе нес, подарок | |||
| 28
    
        trdm 20.12.21✎ 12:47 | 
        (27) ага..     | |||
| 29
    
        fisher 20.12.21✎ 12:49 | 
        (0) Это нечеткая задача. Если для читалки - то я бы забил и просто нашел книгу в другом источнике с нормальным форматированием.     | |||
| 30
    
        Злопчинский 20.12.21✎ 12:50 | 
        м у л ь т и к ан а л ьный - уже предлагали?     | |||
| 31
    
        Bigbro 20.12.21✎ 12:50 | 
        (30) ))) а вы знаток боянов, сэр!     | |||
| 32
    
        trdm 20.12.21✎ 12:52 | 
        (30) выход коррктора: 
 "мультиканальный - уже предлагались" Аж отлегло :) мой софт-не извращенец :) | |||
| 33
    
        fisher 20.12.21✎ 12:53 | 
        (31) Ворд этого слова до сих пор не знает     | |||
| 34
    
        Garykom гуру 20.12.21✎ 12:53 | 
        (0) Алгоритм тут слабовато сказано
 Словарь вряд ли содержит разные окончания Короче для начала разбивать на предложения по знакам препинания ну там "." или "," и т.д. Далее в предложениях убирать " " и искать корни слов из словаря Затем тупо полный перебор чтобы составить правильные предложения | |||
| 35
    
        Злопчинский 20.12.21✎ 12:54 | 
        (31) "Ну так у меня, Петька, и ноги погрязнее твоих будут.."     | |||
| 36
    
        Kassern 20.12.21✎ 13:00 | 
        лучшие умы бьются, чтобы научить ИИ глубокому анализу текста, что он понимал контекст, но до сих пор добиться 100% результата не удается, вот призеры конкурса:
 https://ai.upgreat.one/participants/leaderboard/ | |||
| 37
    
        trdm 20.12.21✎ 13:01 | 
        (26) Это не приоритетная задача, а просто тулза для хобби.     | |||
| 38
    
        Kassern 20.12.21✎ 13:01 | 
        но вы старайтесь, может у вас получиться обучить систему понимать смысл предложения и соединять верно слова)     | |||
| 39
    
        acht 20.12.21✎ 13:03 | 
        (32) > мой софт-не извращенец
 На тебе тесткейсов: о б л о м о в ц ы ш е с т и к а н а л ь н ы й е л ь ц и н и з ма з а д о б р е е т з а р у б е ж о м к о л б а с и т к у л ь т у р о л о г и и о т м е ль к а л а м а х а ч к а л а с т р и п т и з е р ш ей с п е ц н а з о в е ц и м п е р ц е в б е с к а л о р и й н ы й м и р о с л а д а л е д н е ц в е т у щ и й м у х а м м е д а п л е н о ч к а п о х о д о ч к а н а в о з в р а щ а л с а м о к л е й к о й ф у н д а м е н т а л и с т ы | |||
| 40
    
        trdm 20.12.21✎ 13:03 | 
        (38) я уже 4 дня варю эту идею в голове. и 2 деня кодил. 
 пока беру выходной на обдумывание :) | |||
| 41
    
        Garykom гуру 20.12.21✎ 13:03 | 
        (38) Тут такой задачи нет
 Простой перебор с ветвлением и отбрасыванием не сошедшихся предложений по словарю Затык только в полном словаре с окончаниями разными И не словарными частями типа ошибок или неких формул или сокращений | |||
| 42
    
        trdm 20.12.21✎ 13:04 | 
        (39) Выход:
 обломов ц ы шести канальный ель цинизма зад обреет заруб ежом колбаси т культурологии отмель кала маха ч кал а Маха ч кал а стриптизершей спецназовец им перцев бес калорийный миро слада лед не цветущий мухам меда пленочка походочка навоз вращал самок лейкой фундамента листы | |||
| 43
    
        acht 20.12.21✎ 13:07 | 
        (42) Действительно - не извращенец, но сексист =)     | |||
| 44
    
        trdm 20.12.21✎ 13:08 | 
        я не до конца не разобрался с последней колонкой *.aff - файла:
 ru_RU.aff: SET UTF-8 TRY иаоентрвсйлпкыьямдушзбгчщюжцхфэъАКСВПМГБЛТДНИОРФЭЕХЧУЗШЯЮЦЖЙЩ SFX Z Y 4 SFX Z ый о [лнртв]ый SFX Z ий о ький SFX Z ий и [цс]кий SFX Z ий е щий SFX Y Y 435 SFX Y чь жешь чь SFX Y чь жете чь SFX Y чь жет чь SFX Y чь жем чь SFX Y чь гут чь SFX Y чь гу чь SFX Y заться жутся заться SFX Y заться жусь заться SFX Y заться жешься заться SFX Y заться жется заться SFX Y заться жетесь заться SFX Y заться жемся заться SFX Y зать жут зать SFX Y зать жу зать SFX Y зать жешь зать SFX Y зать жете зать SFX Y зать жет зать SFX Y зать жем зать SFX Y ыться удутся быться SFX Y ыться удусь быться SFX Y ыться удешься быться SFX Y ыться удется быться SFX Y ыться удетесь быться SFX Y ыться удемся быться SFX Y ыть удут быть SFX Y ыть уду быть SFX Y ыть удешь быть SFX Y ыть удете быть SFX Y ыть удет быть SFX Y ыть удем быть SFX Y ваться овутся зваться SFX Y ваться овусь зваться SFX Y ваться овешься зваться SFX Y ваться овется зваться SFX Y ваться оветесь зваться SFX Y ваться овемся зваться SFX Y ваться овёшься зваться SFX Y ваться овётся зваться SFX Y ваться овётесь зваться SFX Y ваться овёмся зваться SFX Y вать овут звать SFX Y вать ову звать SFX Y вать овешь звать SFX Y вать овете звать SFX Y вать овет звать SFX Y вать овем звать SFX Y вать овёшь звать SFX Y вать овёте звать SFX Y вать овёт звать SFX Y вать овём звать SFX Y жаться гутся жаться SFX Y жаться гусь жаться SFX Y жать гут жать SFX Y жать гу жать SFX Y ться шься даться SFX Y ться вутся лыться SFX Y ться вусь лыться SFX Y ться вешься лыться SFX Y ться вется лыться SFX Y ться ветесь лыться SFX Y ться вемся лыться SFX Y ться вёшься лыться SFX Y ться вётся лыться SFX Y ться вётесь лыться SFX Y ться вёмся лыться SFX Y ться стся даться SFX Y ться нутся статься SFX Y ться нусь статься SFX Y ться нешься статься SFX Y ться нется статься SFX Y ться нетесь статься SFX Y ться немся статься SFX Y ться мся даться SFX Y ться дутся даться SFX Y ться дитесь даться SFX Y ться димся даться SFX Y ть шь дать SFX Y ть вут лыть SFX Y ть ву лыть SFX Y ть вешь лыть SFX Y ть вете лыть SFX Y ть вет лыть SFX Y ть вем лыть SFX Y ть вёшь лыть SFX Y ть вёте лыть SFX Y ть вёт лыть SFX Y ть вём лыть SFX Y ть ут лезть SFX Y ть у лезть SFX Y ть ст дать SFX Y ть нут стать SFX Y ть ну стать SFX Y ть нешь стать SFX Y ть нете стать SFX Y ть нет стать SFX Y ть нем стать SFX Y ть м дать SFX Y ть ешь лезть SFX Y ть ете лезть SFX Y ть ет лезть SFX Y ть ем лезть SFX Y ть дут дать SFX Y ть дите дать SFX Y ть дим дать SFX Y таться чутся [^с]таться SFX Y таться чусь [^с]таться SFX Y таться чешься [^с]таться SFX Y таться чется [^с]таться SFX Y таться четесь [^с]таться SFX Y таться чемся [^с]таться SFX Y тать чут [^с]тать SFX Y тать чу [^с]тать SFX Y тать чешь [^с]тать SFX Y тать чете [^с]тать SFX Y тать чет [^с]тать SFX Y тать чем [^с]тать SFX Y сться дутся асться SFX Y сться дусь асться SFX Y сться дешься асться SFX Y сться дется асться SFX Y сться детесь асться может кто подскажет что она обозначает? "[лнртв]ый", "[^с]тать" | |||
| 45
    
        trdm 20.12.21✎ 13:10 | 
        +(44) а вот и русский словарь к нему
 ru_RU.dic: 146269 ЧПУ ЧП ЧМ ЧК Чэнду Чжэнчжоу Чувашия/H Чуя/H Чунцин/J Чукотка/H Чухлома/H Чудскому Чудском Чудского Чудское Чудским Чонджу Чогори Читтагонг/J Чита/H Чимкент/J Чимборасо Чили Чикаго Чечня/E Черусти/O Черновцы/O Черногорск/J Черногория/H Черноголовка/H Чернобыль/J Чернигов/J Черненко Черкесск/J Черкассы/O Череповец/G Череповцом Черемушки/O Черёмушки/O Чемульпо Челябинск/J Челны/O Челнов Чеховом Чехов/G Чехословакия/H Чехия/H Чегем/J Чебышев/G Чебышёв/G Чебоксары/O | |||
| 46
    
        fisher 20.12.21✎ 13:16 | 
        (42) Ну и куда оно такое свистит? Для практических целей - бесполезняк. Тут простыми алгоритмами не обойдешься.     | |||
| 47
    
        acht 20.12.21✎ 13:22 | 
        (44) https://mozilla-russia.org/projects/dictionary/hunspell.html
 Пример - прямо в начале "Описание", где "Класс A определяет префикс re-. Класс B — два суффикса -ed: один для слов, оканчивающихся не на y и второй — для оканчивающихся на y." То есть "[лнртв]ый" , он к словам, оканчивающиеся на "лый", "ный", "рый", "тый", "вый". А "[^с]тать" - к словам оканчиваюющися на "тать", но не на "стать" Ну и еще в части "Морфологический анализ" усугбление | |||
| 48
    
        Kassern 20.12.21✎ 13:23 | 
        (42)(41) "фундамента листы" - логика определения первого слова без контекста к этому и приводит. Как вы без него поймете как слова разграничить? Если предложение "С фундамента листы убрать не проблема", то норм разделение, а если "фундаметалисты отвергают либеральный подход в теологии" то уже совсем другое дело.     | |||
| 49
    
        Злопчинский 20.12.21✎ 13:24 | 
        (42) "отмель кала" - это сильно!     | |||
| 50
    
        fisher 20.12.21✎ 13:26 | 
        "бес калорийный" - тоже неплохо     | |||
| 51
    
        fisher 20.12.21✎ 13:28 | 
        Да там каждый третий вариант зажигает.     | |||
| 52
    
        trdm 20.12.21✎ 13:30 | 
        (47) Мерси. На выходных займусь..     | |||
| 53
    
        fisher 20.12.21✎ 13:36 | 
        Нужен максимально полный словарь, генерация всех возможных вариантов предложений по словарю и отсев вариантов на основе анализа синтаксического разбора получившихся предложений. Тогда, в принципе, можно получить более-менее приемлемый результат.     | |||
| 54
    
        Kassern 20.12.21✎ 13:39 | 
        (53) может получиться так, что разделение слова возможно в 2 вариантах предложения. А вот определить какое из них верное возможно лишь при анализе контекста прошлых предолжений. Как тогда быть?)     | |||
| 55
    
        Базис naïve 20.12.21✎ 13:41 | 
        Исходный текст откуда появляется? Распознавание звука?     | |||
| 56
    
        acht 20.12.21✎ 13:43 | 
        (54) Там еще есть слой имен собвственных. Ну их, исключениями наверно можно...
 Кайма новых островов Мал ежик | |||
| 57
    
        fisher 20.12.21✎ 13:48 | 
        (53) + Другими словами, при выработке правил отсева в качестве нейронки придется поработать самому разработчик. Но КМК, неплохого результата можно добиться обозримым набором правил, что позволит получать результаты ненамного хуже, чем на мегаобученной меганейронке. И гораздо эффективнее в части использования ресурсов.
 (54) Тут и нейронка не факт что поможет. Не представляю, как ее на такое обучать, чтобы скайнет в процессе не родился. Цель - получить приемлемый с практической точки зрения результат. (56) Главное, чтобы словарь знал эти имена собственные и варианты с ними тоже попали на вход. А дальше с этим уже можно работать. | |||
| 58
    
        Kassern 20.12.21✎ 13:55 | 
        (57) "Тут и нейронка не факт что поможет" я думаю, что это решаемая задача, прикручиваем квантовые возможности для рассчетов вариантов текстов, сравниваем с миллионами других текстов, где использовались те, или иные варианты словосочетаний и про индексу схожести определяем нужное значение)     | |||
| 59
    
        Kassern 20.12.21✎ 13:57 | 
        либо определяем о чем идет речь в тексте, а далее на основе связанных по смыслу слов определяем как разбить нужные слова.     | |||
| 60
    
        fisher 20.12.21✎ 13:57 | 
        (58) Теоретически может и решаемая. Только вот обучающие данные готовить и размечать пол-китая поседеет, наверное.     | |||
| 61
    
        Kassern 20.12.21✎ 13:59 | 
        (60) уже сейчас есть библиотеки, которые вычленяют существительные/прилагательные из предложений. На основе их попытаться определить контекст и выбирать нужное значение.     | |||
| 62
    
        Kassern 20.12.21✎ 14:00 | 
        (60) сделать типа капчи, дают тебе предложение с разделением ИИ, а ты выбираешь какое верное для авторизации)     | |||
| 63
    
        fisher 20.12.21✎ 14:02 | 
        (61) Ну, примерно это я и имел в виду, когда писал про синтаксический разбор предложений.     | |||
| 64
    
        Pprog151713 20.12.21✎ 14:51 | 
        Скажи, что заносить текст надо правильно. И предложить вариант слипнуть все, а потом разделить в среднем на 5 букв.     | |||
| 65
    
        Garykom гуру 20.12.21✎ 15:08 | 
        (48) просто все возможные варианты получить вполне достаточно
 далее методы ML помогут, нужен словарь частых сочетаний слов и все | |||
| 66
    
        Garykom гуру 20.12.21✎ 15:09 | 
        (65)+ причем не словарь как положительный (возможные сочетания) так и отрицательный на невозможные сочетания
 типа "фундамент" не бывает "либеральным" :) | |||
| 67
    
        acht 20.12.21✎ 15:13 | 
        (66) У тебя точно родной язык русский? =)
 "Но отрицая капитализм как экономику, коммунизм не отверг либерализм в его философских основах. Более того - он состоялся на либеральном фундаменте, продолжив в преображённом виде начатую либералами проповедь свободы." | |||
| 68
    
        Kassern 20.12.21✎ 15:14 | 
        (66) зато может быть словосочетание "Либеральный догматизм как фундамент западного доминирования"     | |||
| 69
    
        Kassern 20.12.21✎ 15:15 | 
        в общем не все так просто)     | |||
| 70
    
        vs84 20.12.21✎ 16:27 | 
        (0) какая практическая задача вызвала необходимость этого? Какой процесс является поставщиком разряженных и слипшихся слов?     | |||
| 71
    
        Ведущий 20.12.21✎ 18:26 | 
        (0) >> Столкнулся с проблемой деления слов на более мелкие :( но правильные.
 Не всегда нужно делить на более мелкие, есть нюансы. Пример: слово "Мультиканальный" лучше не делить. | |||
| 72
    
        Fragster гуру 20.12.21✎ 18:38 | 
        (71) есть варианты, когда вообще хз как, например "поэтому"     | |||
| 73
    
        Ведущий 20.12.21✎ 18:45 | 
        (72) Точно. Нужно поставить задачу с более строгими условиями, тогда и решение проще будет найти.
 Например, если отдельно слово в тексте само по себе является правильным словом, то его не нужно объединять с соседними буквами или пытаться разделить. | |||
| 74
    
        Ведущий 21.12.21✎ 00:13 | 
        (0) Наверное, лучше не "разряженных", а "разреженных", от слова "редко", как разреженный воздух, а не разряженный баллон с газом.     | |||
| 75
    
        Garykom гуру 21.12.21✎ 03:46 | 
        (67) (68) "типа" же
 в этом и суть ML что надо на чем то обучаться, я просто как пример привел редкого сочетания согласен что может быть что угодно примеры чего вы и нашли | |||
| 76
    
        trdm 22.12.21✎ 10:49 | 
| Форум | Правила | Описание | Объявления | Секции | Поиск | Книга знаний | Вики-миста |