|   |   | 
| 
 | Есть два набора слов. Как определить об одном и том же это или нет? | ☑ | ||
|---|---|---|---|---|
| 0
    
        catzilla codzilkin 28.03.25✎ 04:04 | 
        Наборы слов... ООО "Ромашка" и Ромашка (общество с ограниченноей ответственностью)... допустим...
 Как называется по умному такая штука (задача)? И есть ли реализация её в 1С? Может где зарыто в конфигурации... | |||
| 1
    
        H A D G E H O G s 28.03.25✎ 05:37 | 
        АнализДанных с типом ПоискАссоциаций     | |||
| 2
    
        Злоп 28.03.25✎ 08:44 | 
        Ну, для простой задачи с наименованиями фирм можно и не привлекать тяжелую артиллерию.
 Сначала делаем нормализацию названий. Всякие Общество с ограниченной... Заменяем на ООО Индивидуальный предприниматель на Ип итд (по словарю) Убираем спецсимволы, сокращения ставим в конец. Получаем типа Маяк ТД ООО И потом сравниваем | |||
| 3
    
        Злоп 28.03.25✎ 08:45 | 
        Делал такую хрень как-то давно. Нормально себе работало.     | |||
| 4
    
        Злопчинский 28.03.25✎ 08:49 | 
        Дальше есть куча вариантов нечеткого поиска
 https://infostart.ru/1c/tools/14255/ (вк работает и под 8кой), далее метод триграмм и прочие реализации - на ИС их лежит около десятка разных | |||
| 5
    
        H A D G E H O G s 28.03.25✎ 08:59 | 
        Злопчинского и там и тут показывают.     | |||
| 6
    
        Злопчинский 28.03.25✎ 09:02 | 
        (5) на десктопе проще ;-)
 На смартфоне где открытая страница - там и пишу, а залогинен под разными. Как вижу результат сам удивляюсь. | |||
| 7
    
        maxab72 28.03.25✎ 09:05 | 
        (5) вот когда они еще между собой спорить начнут...     | |||
| 8
    
        uno-group 28.03.25✎ 09:36 | 
        (4) С нечетким поиском все не так гладко. Много фирм после н лет работы открывают новое юр лицо стараясь максимально сохранить старое название для узнаваемости. 
 Так и появляются ООО "Рога и копыта" ООО "Рога и копыта и КО" ООО ТД "Рога и копыта" ООО "Копыта и рога" А если это вообще произвольный текст, то классическая фраза Казнить нельзя помиловать в зависимости от запятой это об одном и том же или о разном. | |||
| 9
    
        uno-group 28.03.25✎ 09:38 | 
        У Фирм обычно заполнены еще какие то реквизиты которые позволяют идентифицировать дубли лучше чем нечеткое сравнение названия.     | |||
| 10
    
        catzilla codzilkin 03.04.25✎ 06:53 | 
        (9) 
 В реале задача про автозапчасти... товар в Бозоне Крыло Mazda Demio DE3AS 2007 перед. лев. (б/у) а в базе 1С крыло на MAZDA / DEMIO / DE3AS; DE3FS; DE5FS; DEJFS / / Лево / Перед / Никаких артикулов или кодов из 1С в Бозоне не хранится. Продать продали, а отчитаться проблема. А система налогообложения УСН доходы минус расходы у клиента. Самый мерзопакостный вариант. Нужна себестоимость по каждому товару и оплата чтобы вошло в КУДиР либо в базе бухгалтерии либо в торговой. Может кто сталкивался с подобным? Как решили? По нечеткому поиску мы нашли пост мистовский Нечеткий поиск в 1с 8.3 FuzzySearch - параметры??ysclid=m8z6gxscp4880291889 Компонента встроена в общий макет в конфигурацию. Ссылка на Инфостарт https://infostart.ru/1c/tools/237186/ | |||
| 11
    
        catzilla codzilkin 03.04.25✎ 06:56 | 
        Уже во второй раз сталкиваюсь что УСН 15% не всегда выгоднее УСН 6%, если приплюсовать расходы на формирование КУДиР... а они будут     | |||
| 12
    
        Eiffil123 03.04.25✎ 08:12 | 
        (0) нужен квантовый компьютер от майкрософт     | |||
| 13
    
        АгентБезопасной Нацио 03.04.25✎ 08:42 | 
        (10) а в чем проблема-то? разбиваешь на токены, считаешь корреляцию. Если максимальные коэффициенты корреляции различаются мало, то предлагаешь человеку на коррекцию - выбор из этих вариантов.     | |||
| 14
    
        Кирпич 03.04.25✎ 08:44 | 
        (10) если есть возможность сравнить дату продажи, цену и количество продажи, то можно отсеять по этим параметрам, а потом текст сопоставлять. На примере, так то, найти похожие наименования довольно просто. Тупо разделить по словам и искать слова в наименовании. Ну и составить словарик типовых синонимов Левое:Лев Правое:Прав и т.д     | |||
| 15
    
        mmg 03.04.25✎ 08:51 | 
        (0) По умному - эмбеддинг. По простому вектор. Точка в многомерном, например 512, пространстве. Лежит в основе всех этих чудес с ИИ.
 Вот здесь реализовано в 1С https://infostart.ru/1c/tools/2059795/ | |||
| 16
    
        АгентБезопасной Нацио 03.04.25✎ 08:54 | 
        (14) ну, это лучший вариант - составить таблицы класификаторов. но потом все равно корреляцией     | |||
| 17
    
        uno-group 03.04.25✎ 10:22 | 
        По авто запчастям стремно там бывает на одну букву отличие и запчасть фиг станет. Нужно заводить поле и хранить в нем второе наименование. Провести первоначальное сопоставление и исключение того, что точно совпадает, а по остальному оператору давать список возможных вариантов и пусть человек решает это одно и тоже или нет.     | |||
| 18
    
        АгентБезопасной Нацио 03.04.25✎ 10:24 | 
        (17) да ему-то всего-навсего нужно определить "что продали".     | |||
| 19
    
        uno-group 03.04.25✎ 10:28 | 
        ХЗ сколько у него в базе товаров вполне может быть 3 крыла
 MAZDA / DEMIO / DE3AS; DE3FS; DE5FS; DEJFS / / Лево / Перед / MAZDA / DEMIO / DE3AS; DE3FS; DE5FS; DEJFS / / Лево / Перед / Б/У MAZDA / DEMIO / DE3AS; DE3FS; DE5FS; DEJFS / / Лево / Перед / рестайл. | |||
| 20
    
        АгентБезопасной Нацио 03.04.25✎ 10:30 | 
        (19) может. поэтому у таких товаров коэффициенты корреляции будут очень близкими. поэтому (13)     | |||
| 21
    
        uno-group 03.04.25✎ 10:37 | 
        а если это какие нибуть тормозные колодки то там вообще до 10 производителей может быть на одну и туже модель.
 А есть еще и подделки которые народ выдает за оригинал. Там наименование может отличаться какой ни будь точкой, черточкой кавычкой и т.п. которые как не значищие при поиске тупо откинули. | |||
| 22
    
        uno-group 03.04.25✎ 10:36 | 
        В общем нужно въезжать в тему и разбираться по месту в большинстве случаев чисто программно это не решается.     | |||
| 23
    
        Garykom гуру 03.04.25✎ 11:18 | 
        (10) когда то давно пытался решить подобную задачу
 Алгоритм нахождения подстрок в строке не взлетело, оператор нужен один фиг я пытался автоматизировать процесс на основе некоего обучения чтобы оператор делал для разных образцов, а дальше ИИ сам фигачил | |||
| 24
    
        Irbis 03.04.25✎ 11:28 | 
        Мне бородатый анекдот на эту тему вспомнился, когда за надпись "Пива нет" разнесли ларёк и набили морду пивнику. Как будто нельзя было по-человечески написать "Нет пива"     | |||
| 25
    
        АгентБезопасной Нацио 03.04.25✎ 11:39 | 
        (24) piva.net ?     | |||
| 26
    
        mmg 03.04.25✎ 11:47 | 
        (23) Так обучили уже. Бери и пользуйся     | |||
| 27
    
        mmg 03.04.25✎ 16:14 | 
        (22) Не вводите людей в заблуждение. Сейчас практически во всех случаях "чисто программно решается"     | |||
| 28
    
        Кирпич 03.04.25✎ 21:26 | 
        (27) Нифига это чисто программно не решается. Проверять за компьютером всё равно человеку.     | |||
| 29
    
        Кирпич 03.04.25✎ 21:30 | 
        (23) Чота ты перемудрил с ИИ. В ювелирке всё более менее понятно. Набор проб фиксированный. Для золота и серебра. Драгоценные вставки тоже несколько штук. Нафига там нужен ИИ?     | |||
| 30
    
        Garykom гуру 03.04.25✎ 22:35 | 
        (29) вариантов только как пробу поставщик обозначит несколько десятков
 может написать 585, au585, 585(au), золото 585 и т.д. и да может быть биметалл и напишут нечто вроде 585/875 - сам догадывайся чего еще и в сочетании с весом, хз в каком порядке и без указания "гр." вставки тоже "стандартов" хз сколько для камней (вид, размер, чистота, цвет и т.д.) даже вид изделия умудряются некоторые "к-о" написать вместо "кольцо" и размер через запятую от веса без гр. - что вес а что размер? ", 23, 2.3," - ну да логично что кольцо 23-го размера и вес 2.3 грамма - но как это в коде написать? | |||
| 31
    
        mmg 03.04.25✎ 22:37 | 
        (28) За человеками тоже человеки проверяют. И что ты хотел этим сказать? Что нужно проверять в принципе? Ну да, нужно. Кто спорит. Но, кстати, за ИИ может другой ИИ проверять     | |||
| 32
    
        Кирпич 03.04.25✎ 23:12 | 
        (30) ну если в тексте есть 585, то это уже золото  585 пробы и уже не важно, как оно написано 585au или 585(AU)
 А в коде так и писать. Сначала найти пробу по словарику стандартных проб. Потом размер так же найти. | |||
| 33
    
        Кирпич 03.04.25✎ 23:13 | 
        (31) ну так если человек проверяет, то это уже не "чисто программно решается"     | |||
| 34
    
        Garykom гуру 04.04.25✎ 05:10 | 
        (32) Как отличить артикул BLABLAU585875 от au585?     | |||
| 35
    
        vdementiev 04.04.25✎ 07:13 | 
        "Никаких артикулов или кодов из 1С в Бозоне не хранится" - это показатель развития Bazon. Порядок в артикулах легче поддерживать.     | |||
| 36
    
        Кирпич 04.04.25✎ 07:40 | 
        (34) ну так не пишут же. ты это из пальца высосал.     | |||
| 37
    
        craxx 04.04.25✎ 08:11 | 
        (10) вот как раз в автозапчастях это могут быть разные изделия. От слова "совсем". Там надо на артикул поставщика ориентироваться.     | |||
| 38
    
        Garykom гуру 04.04.25✎ 12:52 | 
        (36) Суть в том что да можно реализовать под некий конкретный формат или даже несколько разных конкретных
 Но не когда их больше сотни и меняются, а какой формат хрен определишь по внешним признакам У ТС примерно тоже самое Да можно все ключевые слова забить ("крыло", "прав(о)(ое)", "лев(о)(ое)" и т.д.) И все марки/модели авто Но стоимость разработки и допилки/поддержки такой надежно работающей без участия оператора системы будет дороже Чем тупо нанять человека-оператора | |||
| 39
    
        Garykom гуру 04.04.25✎ 12:51 | 
        (38)+ Смысл автоматизировать есть когда огромные объемы данных
 С которыми и 10 человек только операторов не справятся Вот тогда да, нанимаем прога и пару операторов - получаем экономию, пусть даже зп прога как 3-4 зп операторов | 
| Форум | Правила | Описание | Объявления | Секции | Поиск | Книга знаний | Вики-миста |