Домашняя страница Undo Do New Save Карта сайта Обратная связь Поиск по форуму
МИР MS EXCEL - Гость.xls

Вход

Регистрация

Напомнить пароль

 

= Мир MS Excel/Поиск дублей и похожих строк в - Мир MS Excel

Старая форма входа
  • Страница 1 из 1
  • 1
Модератор форума: китин  
Мир MS Excel » Работа и общение » Работа / Фриланс » Поиск дублей и похожих строк в (Сравнение строк между собой и маркировка похожих строк)
Поиск дублей и похожих строк в
shanti Дата: Понедельник, 10.02.2014, 01:50 | Сообщение № 1
Группа: Гости
Всем доброго времени! У меня есть такой вопрос:
Есть около 1000 строк в столбце (например А), в каждой строке- текст(от 2 до 5 слов)

Пример:
1) В предложении пять слов
2) Пять слов в предложении
3) Предложение из пяти слов
Вопрос в
Нужно удалить из столбца строки - "дублируюшие" друг друга. Не просто 100% копии
но и те строки в которых разный порядок слов как в строках 1 и 2.
Желательно и удалять разные словоформы. Например (слов , слова , слово)

Возможно ли такое?
Я не профи но может это поможет:
Строки можно разбить на отдельные слова по столицам и как то сравнивать их.
Читал на форуме что строки можно сравнивать в % по похожести друг на друга.
Если это реально то в столбце левее (например B) можно выводить номера строк в которых содержатся похожие значения.

Спасибо, буду ждать ответа))
 
Ответить
СообщениеВсем доброго времени! У меня есть такой вопрос:
Есть около 1000 строк в столбце (например А), в каждой строке- текст(от 2 до 5 слов)

Пример:
1) В предложении пять слов
2) Пять слов в предложении
3) Предложение из пяти слов
Вопрос в
Нужно удалить из столбца строки - "дублируюшие" друг друга. Не просто 100% копии
но и те строки в которых разный порядок слов как в строках 1 и 2.
Желательно и удалять разные словоформы. Например (слов , слова , слово)

Возможно ли такое?
Я не профи но может это поможет:
Строки можно разбить на отдельные слова по столицам и как то сравнивать их.
Читал на форуме что строки можно сравнивать в % по похожести друг на друга.
Если это реально то в столбце левее (например B) можно выводить номера строк в которых содержатся похожие значения.

Спасибо, буду ждать ответа))

Автор - shanti
Дата добавления - 10.02.2014 в 01:50
vikttur Дата: Понедельник, 10.02.2014, 02:07 | Сообщение № 2
Группа: Друзья
Ранг: Участник клуба
Сообщений: 2941
Репутация: 526 ±
Замечаний: 0% ±

http://www.planetaexcel.ru/forum....D=54775
Так Вы за спасибо или все-таки не ошиблись веткой форума? Не берусь, просто вопрос.


Сообщение отредактировал vikttur - Понедельник, 10.02.2014, 03:07
 
Ответить
Сообщениеhttp://www.planetaexcel.ru/forum....D=54775
Так Вы за спасибо или все-таки не ошиблись веткой форума? Не берусь, просто вопрос.

Автор - vikttur
Дата добавления - 10.02.2014 в 02:07
shanti Дата: Понедельник, 10.02.2014, 03:03 | Сообщение № 3
Группа: Пользователи
Ранг: Прохожий
Репутация: 0 ±
Замечаний: 0% ±

Excel 2013
нет не ошибся.. лучше пусть профи сделает чем буду долбиться с этим дня 2)) или дольше
 
Ответить
Сообщениенет не ошибся.. лучше пусть профи сделает чем буду долбиться с этим дня 2)) или дольше

Автор - shanti
Дата добавления - 10.02.2014 в 03:03
doober Дата: Понедельник, 10.02.2014, 13:09 | Сообщение № 4
Группа: Друзья
Ранг: Ветеран
Сообщений: 947
Репутация: 323 ±
Замечаний: 0% ±

Excel 2010
Есть такая у меня функция.Результаты ее работы.
Главное подобрать правильный порог процента совпадения для отбраковки в зависимости от длинны фразы.

[vba]
Код
Фраза1                Фраза2                           % совпадения
В предложении пять слов    Пять слов в предложении     1
В предложении пять слов    Предложение из пяти слов    0,87804878
Пять слов в предложении    Предложение из пяти слов    0,87804878
shanti                    vikttur                        0,307692308
shanti                    doober                       0
vikttur                    doober                        0,153846154
[/vba]




Сообщение отредактировал doober - Понедельник, 10.02.2014, 13:15
 
Ответить
СообщениеЕсть такая у меня функция.Результаты ее работы.
Главное подобрать правильный порог процента совпадения для отбраковки в зависимости от длинны фразы.

[vba]
Код
Фраза1                Фраза2                           % совпадения
В предложении пять слов    Пять слов в предложении     1
В предложении пять слов    Предложение из пяти слов    0,87804878
Пять слов в предложении    Предложение из пяти слов    0,87804878
shanti                    vikttur                        0,307692308
shanti                    doober                       0
vikttur                    doober                        0,153846154
[/vba]

Автор - doober
Дата добавления - 10.02.2014 в 13:09
Hugo Дата: Понедельник, 10.02.2014, 13:13 | Сообщение № 5
Группа: Друзья
Ранг: Участник клуба
Сообщений: 3253
Репутация: 707 ±
Замечаний: 0% ±

2019
Сергей, а эти как сверит?
В предлложении пять сов
Пять слов в предложении


excel@nxt.ru
webmoney: E265281470651 Z422237915069
 
Ответить
СообщениеСергей, а эти как сверит?
В предлложении пять сов
Пять слов в предложении

Автор - Hugo
Дата добавления - 10.02.2014 в 13:13
doober Дата: Понедельник, 10.02.2014, 13:18 | Сообщение № 6
Группа: Друзья
Ранг: Ветеран
Сообщений: 947
Репутация: 323 ±
Замечаний: 0% ±

Excel 2010
1,0,что не есть хорошо.
я функцию на лету поравил,она придерживалась порядка знаков в фразе


 
Ответить
Сообщение1,0,что не есть хорошо.
я функцию на лету поравил,она придерживалась порядка знаков в фразе

Автор - doober
Дата добавления - 10.02.2014 в 13:18
shanti Дата: Понедельник, 10.02.2014, 23:45 | Сообщение № 7
Группа: Пользователи
Ранг: Прохожий
Репутация: 0 ±
Замечаний: 0% ±

Excel 2013
Есть такая у меня функция.Результаты ее работы.
Главное подобрать правильный порог процента совпадения для отбраковки в зависимости от длинны фразы.

Фраза1                Фраза2                           % совпадения
В предложении пять слов    Пять слов в предложении     1
В предложении пять слов    Предложение из пяти слов    0,87804878
Пять слов в предложении    Предложение из пяти слов    0,87804878
shanti                    vikttur                        0,307692308
shanti                    doober                       0
vikttur                    doober                        0,153846154


А реально ли сделать чтобы работало как в описанном примере ?
 
Ответить
Сообщение
Есть такая у меня функция.Результаты ее работы.
Главное подобрать правильный порог процента совпадения для отбраковки в зависимости от длинны фразы.

Фраза1                Фраза2                           % совпадения
В предложении пять слов    Пять слов в предложении     1
В предложении пять слов    Предложение из пяти слов    0,87804878
Пять слов в предложении    Предложение из пяти слов    0,87804878
shanti                    vikttur                        0,307692308
shanti                    doober                       0
vikttur                    doober                        0,153846154


А реально ли сделать чтобы работало как в описанном примере ?

Автор - shanti
Дата добавления - 10.02.2014 в 23:45
shanti Дата: Вторник, 11.02.2014, 00:25 | Сообщение № 8
Группа: Пользователи
Ранг: Прохожий
Репутация: 0 ±
Замечаний: 0% ±

Excel 2013
Вот пример сделал)
К сообщению приложен файл: 6194402.xls (39.5 Kb)


Сообщение отредактировал shanti - Вторник, 11.02.2014, 00:26
 
Ответить
СообщениеВот пример сделал)

Автор - shanti
Дата добавления - 11.02.2014 в 00:25
doober Дата: Вторник, 11.02.2014, 00:53 | Сообщение № 9
Группа: Друзья
Ранг: Ветеран
Сообщений: 947
Репутация: 323 ±
Замечаний: 0% ±

Excel 2010
Реально,но я делать не буду.
Вам же на планете pharmaprofi подсказал правильную идею.


 
Ответить
СообщениеРеально,но я делать не буду.
Вам же на планете pharmaprofi подсказал правильную идею.

Автор - doober
Дата добавления - 11.02.2014 в 00:53
shanti Дата: Вторник, 11.02.2014, 11:29 | Сообщение № 10
Группа: Пользователи
Ранг: Прохожий
Репутация: 0 ±
Замечаний: 0% ±

Excel 2013
Реально,но я делать не буду.
Вам же на планете pharmaprofi подсказал правильную идею.

Ок - не делайте..

Тема актуальна - жду других предложений.
 
Ответить
Сообщение
Реально,но я делать не буду.
Вам же на планете pharmaprofi подсказал правильную идею.

Ок - не делайте..

Тема актуальна - жду других предложений.

Автор - shanti
Дата добавления - 11.02.2014 в 11:29
altblog Дата: Суббота, 30.05.2015, 16:55 | Сообщение № 11
Группа: Пользователи
Ранг: Прохожий
Сообщений: 6
Репутация: 0 ±
Замечаний: 0% ±

Excel 2019
Здравствуйте! У меня похожая проблема, только немного проще — некоторые предложения обрезаны.
В столбце А: Сей пшеницу на Симона Зилота - родится, аки золото (западн
В столбце B где-то из 80 тысяч строк есть полная версия пословицы: Сей пшеницу на Симона Зилота - родится, аки золото (западн.).
Надо проверить каждую строчку в столбце A (80 тысяч строк) и найти полную версию предложения в столбце B и указать ее в столбце C.
Установил Fuzzy Lookup, но он не появился в надстройках :(

Оплата по WebMoney, QIWI или Яндекс.Деньги.
 
Ответить
СообщениеЗдравствуйте! У меня похожая проблема, только немного проще — некоторые предложения обрезаны.
В столбце А: Сей пшеницу на Симона Зилота - родится, аки золото (западн
В столбце B где-то из 80 тысяч строк есть полная версия пословицы: Сей пшеницу на Симона Зилота - родится, аки золото (западн.).
Надо проверить каждую строчку в столбце A (80 тысяч строк) и найти полную версию предложения в столбце B и указать ее в столбце C.
Установил Fuzzy Lookup, но он не появился в надстройках :(

Оплата по WebMoney, QIWI или Яндекс.Деньги.

Автор - altblog
Дата добавления - 30.05.2015 в 16:55
nilem Дата: Суббота, 30.05.2015, 19:25 | Сообщение № 12
Группа: Авторы
Ранг: Старожил
Сообщений: 1613
Репутация: 563 ±
Замечаний: 0% ±

Excel 2013, 2016
altblog, привет
т.е. нужны полные соответствия?
примерчик файла покажете? (или присылайте на почту)


Яндекс.Деньги 4100159601573
 
Ответить
Сообщениеaltblog, привет
т.е. нужны полные соответствия?
примерчик файла покажете? (или присылайте на почту)

Автор - nilem
Дата добавления - 30.05.2015 в 19:25
altblog Дата: Суббота, 30.05.2015, 19:52 | Сообщение № 13
Группа: Пользователи
Ранг: Прохожий
Сообщений: 6
Репутация: 0 ±
Замечаний: 0% ±

Excel 2019
nilem, если я вас правильно понял, то да.
К сообщению приложен файл: 4663798.xls (20.0 Kb)
 
Ответить
Сообщениеnilem, если я вас правильно понял, то да.

Автор - altblog
Дата добавления - 30.05.2015 в 19:52
nilem Дата: Суббота, 30.05.2015, 20:07 | Сообщение № 14
Группа: Авторы
Ранг: Старожил
Сообщений: 1613
Репутация: 563 ±
Замечаний: 0% ±

Excel 2013, 2016
Ну вот, пробуйте
К сообщению приложен файл: _4663798.xls (42.0 Kb)


Яндекс.Деньги 4100159601573
 
Ответить
СообщениеНу вот, пробуйте

Автор - nilem
Дата добавления - 30.05.2015 в 20:07
altblog Дата: Суббота, 30.05.2015, 20:29 | Сообщение № 15
Группа: Пользователи
Ранг: Прохожий
Сообщений: 6
Репутация: 0 ±
Замечаний: 0% ±

Excel 2019
nilem, вроде работает. Спасибо! Сколько я должен и куда оплатить?
 
Ответить
Сообщениеnilem, вроде работает. Спасибо! Сколько я должен и куда оплатить?

Автор - altblog
Дата добавления - 30.05.2015 в 20:29
nilem Дата: Суббота, 30.05.2015, 20:32 | Сообщение № 16
Группа: Авторы
Ранг: Старожил
Сообщений: 1613
Репутация: 563 ±
Замечаний: 0% ±

Excel 2013, 2016
сколько должен - смотрите сами; куда оплатить - номер на Яндексе в подписи


Яндекс.Деньги 4100159601573

Сообщение отредактировал nilem - Воскресенье, 31.05.2015, 06:27
 
Ответить
Сообщениесколько должен - смотрите сами; куда оплатить - номер на Яндексе в подписи

Автор - nilem
Дата добавления - 30.05.2015 в 20:32
Мир MS Excel » Работа и общение » Работа / Фриланс » Поиск дублей и похожих строк в (Сравнение строк между собой и маркировка похожих строк)
  • Страница 1 из 1
  • 1
Поиск:

Яндекс.Метрика Яндекс цитирования
© 2010-2024 · Дизайн: MichaelCH · Хостинг от uCoz · При использовании материалов сайта, ссылка на www.excelworld.ru обязательна!