Домашняя страница Undo Do New Save Карта сайта Обратная связь Поиск по форуму
МИР MS EXCEL - Гость.xls

Вход

Регистрация

Напомнить пароль

 

= Мир MS Excel/Парсинг большого числа страниц - Мир MS Excel

Старая форма входа
  • Страница 1 из 1
  • 1
Модератор форума: китин  
Мир MS Excel » Работа и общение » Работа / Фриланс » Парсинг большого числа страниц
Парсинг большого числа страниц
pabchek Дата: Вторник, 22.10.2019, 12:58 | Сообщение № 1
Группа: Проверенные
Ранг: Ветеран
Сообщений: 931
Репутация: 218 ±
Замечаний: 0% ±

Excel 2007
Коллеги, здравствуйте!
У меня задача собрать описание товара с сайтов интернет магазинов - например, одежда: размер, цвет, описание (всего около 50 параметров). Есть для примера список урлов больше 200 тыс.
Я кое как реализовал через VBA. Работает, но на одну ссылку уходит около 1,5 сек. Очень долго. В других технологиях не шарю (питон или еще что?). Может кто-нибудь помочь?
Пример ссылок (не знаю в какие тэги взять, не обессудьте):
https://www.wildberries.ru/catalog/804817/detail.aspx?targetUrl=NW
https://www.wildberries.ru/catalog/923902/detail.aspx?targetUrl=NW


"Учиться, учиться и еще раз учиться!"
WM: R399923528092
 
Ответить
СообщениеКоллеги, здравствуйте!
У меня задача собрать описание товара с сайтов интернет магазинов - например, одежда: размер, цвет, описание (всего около 50 параметров). Есть для примера список урлов больше 200 тыс.
Я кое как реализовал через VBA. Работает, но на одну ссылку уходит около 1,5 сек. Очень долго. В других технологиях не шарю (питон или еще что?). Может кто-нибудь помочь?
Пример ссылок (не знаю в какие тэги взять, не обессудьте):
https://www.wildberries.ru/catalog/804817/detail.aspx?targetUrl=NW
https://www.wildberries.ru/catalog/923902/detail.aspx?targetUrl=NW

Автор - pabchek
Дата добавления - 22.10.2019 в 12:58
astatsa Дата: Среда, 23.10.2019, 07:39 | Сообщение № 2
Группа: Пользователи
Ранг: Прохожий
Сообщений: 2
Репутация: 7 ±
Замечаний: 0% ±

Excel 2013
Добрый день!

Удалено. Нарушение п.4 Правил ветки РАБОТА/ФРИЛАНС


Сообщение отредактировал Pelena - Четверг, 24.10.2019, 21:24
 
Ответить
СообщениеДобрый день!

Удалено. Нарушение п.4 Правил ветки РАБОТА/ФРИЛАНС

Автор - astatsa
Дата добавления - 23.10.2019 в 07:39
doober Дата: Четверг, 24.10.2019, 20:23 | Сообщение № 3
Группа: Друзья
Ранг: Ветеран
Сообщений: 947
Репутация: 323 ±
Замечаний: 0% ±

Excel 2010
Если не забанят, то можно потоков в 10 и более сделать сбор.


 
Ответить
СообщениеЕсли не забанят, то можно потоков в 10 и более сделать сбор.

Автор - doober
Дата добавления - 24.10.2019 в 20:23
pabchek Дата: Четверг, 24.10.2019, 23:33 | Сообщение № 4
Группа: Проверенные
Ранг: Ветеран
Сообщений: 931
Репутация: 218 ±
Замечаний: 0% ±

Excel 2007
Если не забанят

Про потоки сам думал. Не рискнул, побоялся забанят))


"Учиться, учиться и еще раз учиться!"
WM: R399923528092
 
Ответить
Сообщение
Если не забанят

Про потоки сам думал. Не рискнул, побоялся забанят))

Автор - pabchek
Дата добавления - 24.10.2019 в 23:33
doober Дата: Пятница, 25.10.2019, 01:10 | Сообщение № 5
Группа: Друзья
Ранг: Ветеран
Сообщений: 947
Репутация: 323 ±
Замечаний: 0% ±

Excel 2010
Тогда никак не ускорить


 
Ответить
СообщениеТогда никак не ускорить

Автор - doober
Дата добавления - 25.10.2019 в 01:10
pabchek Дата: Пятница, 25.10.2019, 09:28 | Сообщение № 6
Группа: Проверенные
Ранг: Ветеран
Сообщений: 931
Репутация: 218 ±
Замечаний: 0% ±

Excel 2007
Ну раз гуру парсинга (и не только) сказал "нет", похоже на приговор)) Наверно, тему можно закрывать.


"Учиться, учиться и еще раз учиться!"
WM: R399923528092


Сообщение отредактировал pabchek - Пятница, 25.10.2019, 09:28
 
Ответить
СообщениеНу раз гуру парсинга (и не только) сказал "нет", похоже на приговор)) Наверно, тему можно закрывать.

Автор - pabchek
Дата добавления - 25.10.2019 в 09:28
Мир MS Excel » Работа и общение » Работа / Фриланс » Парсинг большого числа страниц
  • Страница 1 из 1
  • 1
Поиск:

Яндекс.Метрика Яндекс цитирования
© 2010-2024 · Дизайн: MichaelCH · Хостинг от uCoz · При использовании материалов сайта, ссылка на www.excelworld.ru обязательна!