Реклама на сайте English version  DatasheetsDatasheets

KAZUS.RU - Электронный портал. Принципиальные схемы, Datasheets, Форум по электронике

Новости электроники Новости Литература, электронные книги Литература Документация, даташиты Документация Поиск даташитов (datasheets)Поиск PDF
  От производителей
Новости поставщиков
В мире электроники

  Сборник статей
Электронные книги
FAQ по электронике

  Datasheets
Поиск SMD
Он-лайн справочник

Принципиальные схемы Схемы Каталоги программ, сайтов Каталоги Общение, форум Общение Ваш аккаунтАккаунт
  Каталог схем
Избранные схемы
FAQ по электронике
  Программы
Каталог сайтов
Производители электроники
  Форумы по электронике
Помощь проекту

Делимся опытом Наступив на грабли - сообщи другим! Обмен опытом разработки и ремонта электронных устройств.

 
Опции темы
Непрочитано 05.04.2014, 12:13  
Скайнет
Заблокирован
 
Регистрация: 22.02.2014
Сообщений: 807
Сказал спасибо: 3
Сказали Спасибо 185 раз(а) в 131 сообщении(ях)
Скайнет на пути к лучшему
По умолчанию Делимся опытом: кто какими программами для автоматизации поиска в интернете пользуется

Какие требования к таким программам у меня:
1. Программа должна уметь посылать последовательно поисковые запросы юзверя из некоторого заданного юзверем списка последовательно на несколько ЗАДАННЫХ ЮЗВЕРЕМ поисковиков
2.Какие поисковики использовать должно задаваться юзверем. И чтобы юзверь мог добавить в список любой понравившийся ему интернет-поисковик
3.Глубина поиска (сколько страниц выдачи и какие конкретно номера страниц принимать во внимание) должно для каждого поисковика задаваться юзверем
4.Программа должна уметь объединять результаты выдачи с разных поисковиков в одну результирующую выдачу
5.Программа должна уметь не показывать в результирующей выдаче сниппеты-клоны. Правила, по которым сниппеты считаются клонами, должны задаваться юзверем
6.Программа должна уметь объединять сниппеты, имеющие одну и ту же главную ссылку, но разный текст, в один сниппет.
7.Программа должна уметь не показывать в результирующей выдаче сниппеты, которые удовлетворяют какой-нибудь строке (или правилу) "черного списка"
8.Все сниппеты должны сохраняться в специальную базу данных из которой в любой момент можно сгенерировать выдачу по следующим атрибутам (причём можно выбирать сниппеты задействуя сразу несколько атрибутов строя из них логические выражения):
8.а) Порядковый номер поискового задания (например "выдать все сниппеты" полученные в 234...321 заданиях, или "выдать сниппеты последних 5-ти поисковых заданий")
8.б) Все сниппеты URL главной ссылки которых удовлетворяет спец файлу "URL-s.txt"
8.в) Все сниппеты найденные в поиске, в поисковом запросе которого содержалась/не содержалась заданная цепочка символов (цепочка определяется списком REGEXP-ов)
8.г) Все сниппеты, найденные поисковым запросом, помеченным заданными иерархическим тегами
8.д) Все сниппеты, найденные заданным поисковиком (например показывать сниппеты, найденные только яндексом и гуглом) или только УНИКАЛЬНЫЕ сниппеты (т.е. которые нашёл только этот поисковик и не нашли другие)
8.е) Новые сниппеты (которых не было в базе данных), добавленные в базу данных в указанный промежуток времени
9.Чтобы можно (использую базу данных) смотреть разного рода статистику
9.а) Для каждой ссылки посмотреть список поисковых запросов при которых был найдена данная ссылка и какими поисковиками
9.б) Для каждого поисковика посмотреть ЭФФЕКТИВНОСТЬ поисковика, т.е. сколько уникальных ссылок он выдал в поисковых заданиях с заданными номерами или в поисковых заданиях, обновленных в заданный промежуток времени


Теперь о терминах

1) Под "сниппетом" я понимаю информацию о ссылке, которую выдаёт поисковик. Т.е. это как бы минимальный кубик информации, который будет сохранятся в базу данных. При этом при сохранении в базу данных к нему будут добавлены другие поля (типа, каким поисковиком был найден, каким поисковым заданием, когда и т.п.)


2) Под "поисковым заданием" я понимаю некий блок данных (возможно хранимый как отдельный файл) в котором юзверь определяет список поисковых запросов и то на какие поисковики их посылать и на какую глубину искать.

Т.е. типа что-то в таком духе:

Цитата:
1.Искать: мама папа я спортивная семья
1.1 в гугле на страницах: 1,2,4, 45, 56
1.2 в яндексе на страницах:1,2,...,7,12
+ Добавлять в результирующую выдачу только сниппеты, удовлетворяющие списку правил E:\Белые списки\Здоровье.txt
- Исключить из результирующей выдачи сниппеты, удовлетворяющие списку правил E:\Черные списки\Всякий рекламный мусор.txt
-----------------------------------------------
2.Искать: я /+1 ("у мамы") /(+1 +2) (дурачок | простачок)
2.1.в яндексе на страницах 1,...,4
+ Добавлять в результирующую выдачу только сниппеты, удовлетворяющие списку правил E:\Белые списки\Про психов.txt
- Исключить из результирующей выдачи сниппеты, удовлетворяющие списку правил E:\Черные списки\Это я уже читал.txt

Т.е. поисковое задание это как бы план работ по поиску и отбору нужной информации:"Найди это там, потом найди то здесь и ...."
Таким образом можно дать проге задание и пойти пить чай пока она ищет, сортирует, выделяет, удаляет.
Вместо того, чтобы вручную набивать поисковые запросы в разные поисковики, вручную определять дубли.

А потом, поисковое задание сохраняется. И всегда можно его запустить по новой и посмотреть "а не появилось ли чего нового по данной тематике?" Т.е. посмотреть только новые сниппеты, которых ещё не было в базе данных


я знаю только одну программу, которую хоть в какой-то степени удовлетворяет описанным выше требованиям.
Это FileForFiles (бывш. SiteSpunik).
Если Вы знаете ещё программы с подобным функционалом - подскажите. Буду премного благодарен
Скайнет вне форума  
Непрочитано 06.04.2014, 12:00  
raxp
Почётный гражданин KAZUS.RU
 
Регистрация: 28.05.2010
Сообщений: 1,118
Сказал спасибо: 150
Сказали Спасибо 604 раз(а) в 310 сообщении(ях)
raxp на пути к лучшему
По умолчанию Re: Делимся опытом: кто какими программами для автоматизации поиска в интернете пользуется

У вас темы какие-то неинтересные, все самое лучшее, кто чем пользуется. Вы статистику в каких целях собираете?

Все поисковики уже забиты в браузере, выбрать можно любой. Как правило, это гугл и яндекс. Также у меня дополнительно назначены дак-дак и nigma.ru.
__________________
Белорусский журнал «Радиолюбитель»
Youtube LaboratoryW
UR3QQJ
raxp вне форума  
Непрочитано 06.04.2014, 12:12  
Scadauser
Почётный гражданин KAZUS.RU
 
Регистрация: 04.12.2009
Сообщений: 5,455
Сказал спасибо: 73
Сказали Спасибо 2,510 раз(а) в 1,414 сообщении(ях)
Scadauser на пути к лучшему
По умолчанию Re: Делимся опытом: кто какими программами для автоматизации поиска в интернете пользуется

Сообщение от raxp Посмотреть сообщение
У вас темы какие-то неинтересные
Забейте в гугле "Доктор ТуамОсес"
Например:
http://forum.abok.ru/index.php?showtopic=94288
Scadauser вне форума  
Непрочитано 06.04.2014, 12:39  
pambaru
Почётный гражданин KAZUS.RU
 
Регистрация: 24.03.2007
Сообщений: 1,330
Сказал спасибо: 85
Сказали Спасибо 596 раз(а) в 361 сообщении(ях)
pambaru на пути к лучшему
По умолчанию Re: Делимся опытом: кто какими программами для автоматизации поиска в интернете пользуется

Сообщение от raxp Посмотреть сообщение
У вас темы какие-то неинтересные, все самое лучшее, кто чем пользуется. Вы статистику в каких целях собираете?
Это, возможно, просто реклама своего софта.
pambaru вне форума  
Непрочитано 06.04.2014, 20:53  
Скайнет
Заблокирован
 
Регистрация: 22.02.2014
Сообщений: 807
Сказал спасибо: 3
Сказали Спасибо 185 раз(а) в 131 сообщении(ях)
Скайнет на пути к лучшему
По умолчанию Re: Делимся опытом: кто какими программами для автоматизации поиска в интернете пользуется

Сообщение от raxp Посмотреть сообщение
У вас темы какие-то неинтересные
"На вкус и цвет товарища нет"©
Вам эта тема не интересна, а кому-то интересна
Скайнет вне форума  
Непрочитано 08.04.2014, 19:19  
raxp
Почётный гражданин KAZUS.RU
 
Регистрация: 28.05.2010
Сообщений: 1,118
Сказал спасибо: 150
Сказали Спасибо 604 раз(а) в 310 сообщении(ях)
raxp на пути к лучшему
По умолчанию Re: Делимся опытом: кто какими программами для автоматизации поиска в интернете пользуется

Сообщение от Scadauser Посмотреть сообщение
Забейте в гугле "Доктор ТуамОсес"
Например:
http://forum.abok.ru/index.php?showtopic=94288
а, ну этот персонаж нам знаком.
__________________
Белорусский журнал «Радиолюбитель»
Youtube LaboratoryW
UR3QQJ
raxp вне форума  
Непрочитано 11.04.2014, 14:42  
Скайнет
Заблокирован
 
Регистрация: 22.02.2014
Сообщений: 807
Сказал спасибо: 3
Сказали Спасибо 185 раз(а) в 131 сообщении(ях)
Скайнет на пути к лучшему
По умолчанию Re: Делимся опытом: кто какими программами для автоматизации поиска в интернете пользуется

Ну так чо? Кроме SiteSputnik (aka FileForFiles) таких программ больше нету что-ли?
Скайнет вне форума  
Непрочитано 29.04.2014, 10:29  
Скайнет
Заблокирован
 
Регистрация: 22.02.2014
Сообщений: 807
Сказал спасибо: 3
Сказали Спасибо 185 раз(а) в 131 сообщении(ях)
Скайнет на пути к лучшему
По умолчанию Re: Делимся опытом: кто какими программами для автоматизации поиска в интернете пользуется

Ведь при поиске в интернете какие самые важные проблемы:
1) Нужная информация находится среди кучи не нужной ("левой") информации
2) Повторно попадается одна и та же информация

В решении этих проблем и должна помогать программа для поиска в интернете
Скайнет вне форума  
Непрочитано 01.05.2014, 01:21  
thedude
Прохожий
 
Регистрация: 22.02.2005
Сообщений: 2
Сказал спасибо: 3
Сказали Спасибо 0 раз(а) в 0 сообщении(ях)
thedude на пути к лучшему
По умолчанию Re: Делимся опытом: кто какими программами для автоматизации поиска в интернете пользуется

Copernic Agent
thedude вне форума  
Непрочитано 03.05.2014, 12:18  
Скайнет
Заблокирован
 
Регистрация: 22.02.2014
Сообщений: 807
Сказал спасибо: 3
Сказали Спасибо 185 раз(а) в 131 сообщении(ях)
Скайнет на пути к лучшему
По умолчанию Re: Делимся опытом: кто какими программами для автоматизации поиска в интернете пользуется

Сообщение от thedude Посмотреть сообщение
Copernic Agent
Юсал это программу "на заре туманной юности".
Но, ЕМНИП, у неё какие-то косяки вроде были с русским языком
Скайнет вне форума  
 

Закладки
Опции темы

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход

Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Апгрейд и комплектующие для ноутбуков mikesmith Барахолка электронных компонентов 28 17.05.2023 23:25
Вы родом из 70-80х если: baskervil Отвлекитесь, эмбеддеры! 163 23.10.2008 22:26
из DVD в DVD-player реально? Altalimir Микроконтроллеры, АЦП, память и т.д 14 17.09.2007 21:21
[Решено] Сборник перлов любителей кабельщины mikesmith Отвлекитесь, эмбеддеры! 135 14.08.2007 15:49


Часовой пояс GMT +4, время: 15:46.


Powered by vBulletin® Version 3.8.4
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd. Перевод: zCarot