Мелочи :: Разработчик СайтСпутник, документация, где скачать :: Форум СПКР (47)


Первоисточник: http://forum.razved.info/index.php?t=2344&p=57194
Компиляция: программой SiteSputnik - https://sitesputnik.ru/

 
ara_367519
Долгожитель форума

Откуда: г. Пенза
Всего сообщений: 818
Рейтинг пользователя: 17


Ссылка


Дата регистрации на форуме:
4 дек. 2012
Да), об этом А.Масалович говорил, не очень давно.. добавляйтесь к нам в группу интернет-разведка на ФБ, там много интересного))

---
истина где-то рядом...
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 872
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

ara_367519 написал:
[q]
не очень давно..
[/q]
    Здесь на форуме уже достаточно давно (более, чем год назад), про телефон подсказал Семеныч - Фичи Facebook (спасибо ему). А оказалось, что и e-mail ещё можно "пробить". Вот в пробивку E-mail и была добавлена проверка: не был ли пробиваемый E-mail использован при регистрации в Фейсбуке, а если был использован, то кем. Телефон при регистрации в ФБ не обязательно указывать, а E-Mail всегда нужно указывать. Казалось бы мелочь, но она очень даже может помочь.

    Кстати, в пробивку E-mail я ещё добавил проверку имени, которое идет до знака @: проверяю на абсолютно точное совпадение, если имя состоит из букв и цифр и длиннее 6 символов. Это тоже бывает полезным и не приносит практически мусора.

    И ещё.
    "Распыление" по ФБ, ВК и другим источникам - это нормальное явление, но если Вы нашли хорошую фичу и хотите донести её до широкого круга Пользователей, то пишите о ней здесь на форуме тоже.




Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 872
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

Алексей Мыльников написал:
[q]
3. Пункт Искать по теме - в стадии проектирования.
[/q]
    В настоящий момент в SiteSputnik Pro версии 9.2.3 от 29.11.16 реализована чисто вспомогательная функция генерации Пакета запросов на основе выделенного абзаца или более длинного фрагмента текста.

    Принцип следующий. Как правило, предложение несет в себе какую-то смысловую нагрузку, соответственно, выделенный фрагмент текста разбивается на предложения, из которых составляются запросы. Запросы посылаются на новостные источники раздельно. Затем делается их "Аналитическое объединение", которое в начало выдачи поднимает ссылки, удовлетворяющие большему количеству запросов.

    Сгенерированный Пакет запросов перед выполнением предварительно показывается Пользователю, который может отредактирвать запросы и прописать их выполнение на других источниках.

    Для этапа поиска, думаю что это довольно-таки практичное решение. Другое дело - этап Рубрикации, который в этой функции не применяется.

    Обращение к данной функции следующее: подменю "Золотого ключика" - Поиск по выделенному тексту - Искать по теме - Сгенерировать Пакет запросов.


Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 872
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

    Приписать в выдаче к сниппету (ссылке) Источник и Запрос - новый параметр в Настройках, размещён на вкладке Pro.

    Название параметра говорит само за себя: Источник, в котором найден сниппет (ссылка) и запрос, при помощи которого он был найден, приписываются в конец сниппета.

    Этот параметр помогает понять какой Источник, по какому Запросу, какую информацию принес в выдачу. Полезено, когда Пакет запросов состоит из нескольких Источников и нескольких Запросов.

    Другими словами, он помогает "на месте" (не прокручивая выдачу, не заглядывая в Пакет запросов и Настройки) понять какие Источники и Запросы приносят нужную информацию, а какие нет.

    По умолчанию параметр выключен.

    Доступно в SiteSputnik Pro v.9.2.6 от 09.01.17 и выше.

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 872
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

    Два новых параметра, размещены на вкладке +News:

    - Не выводить Правило попадания в Рубрику - в конец Рубрики не дописывается Правило, которому она удовлетворила. Бывает полезным, если Правило очень большое (например, больше самой новости или сообщения) и мешает просмотру результатов работы.

    - Не Рубрицировать офисные и другие не-html-файлы - офисные файлы иногда попадаются очень большие, например, книга на 600 страниц, соотвественно, обработка такого файла ресурсоёмкая, и если точно известно, что в файле не будет нужной информации, например, если "вычисляем" все интервью Трампа за 2016 год, то есть смысл применить этот параметр.

    Доступно в SiteSputnik Pro+News v.9.2.7.3 от 02.02.17 и выше.

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 872
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
    Мониторинг страничек в Instagram

    В SiteSputnik News+WebSpider версии 9.3.2 от 20.02.17 добавлены средства мониторинга страничек из Инстаграм (внутрь100грамм).

    Прописать страничку из Инстаграм в Проекте можно следующим образом:

    %ИГ=https://www.instagram.com/mossobyanin/
    или
    https://www.instagram.com/mossobyanin/ +/p/


    Важное замечание.
    Т.к. в Инстаграм комментарии не оформляются отдельной ссылкой, а приписываются в ссылку, создаваемую при первом Посте, то для отслеживания новых комментариев, написанных после последнего выполнения Проекта, следует применить возможности модуля +WebSpiser, а именно, прописать в Проекте оператор ^^WebSpider;.
    В этом случае СайтСпутник будет сравнивать новые и предыдущие состояния ссылок, находить и выделять в них только новые комментарии и отправлять их на Рубрикацию.

    Пример небольшого Проекта для наблюдением сразу за 7 страничками из Инстаграм на предмет отслеживания новых сообщений и комментариев о "Масленице", "Днях рождениях" и "О полиции":


    %ИГ=https://www.instagram.com/alexei_mylnikov/
    %ИГ=https://www.instagram.com/mossobyanin/
    %ИГ=https://www.instagram.com/skyment/
    %ИГ=https://www.instagram.com/roman.romachev/
    %ИГ=https://www.instagram.com/tov.nachoperot/
    %ИГ=https://www.instagram.com/alex.mitrofanov/
    %ИГ=https://www.instagram.com/yushchuk/

    Рубрика://Праздники/Масленица
    Масленица | Масленница | !блины*

    Рубрика://Праздники/День Рождения
    День /1 рождения | Днюха

    Рубрика://МВД/О полиции
    Полиция | Милиция | !мент*

    ^^WebSpider;


    Результат работы на тему "Масленица" представлен на ссылке.
    В качестве одного из Правил попадания информации в Рубрику использовано: Масленница, на случай написания этого слова с грамматической ошибкой.


    Дополнительная информация.
    Если у Вас Internet Explorer 9 (IE 9), то обновите его до IE 11 из самого IE следующим образом: "Справка - Техническая поддержка - ...".

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 872
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

    Поиск новых Сайтов и Доменов 3-го уровня


    Список Ссылки новые уже сушествует давно.
    Он содержит только новые уникальные ссылки, которые не встречались ещё ни разу ни в одном из предыдущих выполнений Проекта (впервые найденные ссылки).

    Теперь к нему добавлены ещё два списка.

    Сайты новые (Домены 2-го уровня новые)

    Список "Сайты новые" содержит только впервые найденные сайты, то есть, те сайты, ссылки с которых ещё ни разу не были найдены ни в одном из предыдущих выполнений Проекта (Пакета запросов).

    Удобно, например, тогда, когда ищутся сайты, посвященные какой-то теме - Пользователю не придется повторно просматривать ранее найденные сайты.



    Домены 3-го уровня новые

    Список "Домены 3-го уровня новые" содержит только впервые найденные Домены 3-го уровня.

    Удобно, например, тогда, когда нужные темы находятся на таких cайтах как livejournal.com.


    Доступно, начиная с Site Sputnik версии 9.4.4 от 21.09.2017 г.


Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 872
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

    Сохранение в формате PDF, DOCX, RTF, TXT, MHT, HTM.



    Практически любой файл (Рубрику, Чистый поток, Объединение, Ссылки новые, ...) можно сохранить как документ в форматах, указанных в заголовке топика.

    Обращение: "Главное меню - Файлы - Сохранить как документ ..." (показано на картинке) или про нажатию правой кнопки мышки на нижней Табличке.

    Доступно, начиная с SiteSputnik 9.5.6 от 30.01.2018 г.

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 872
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

    Работа со списками "Сайты новые" и "Домены 3-го уровня новые"


    В топике № 88 из этой темы (см. на два топика выше) сообщалось о создании списков "Сайты новые" (Домены 2-го уровня новые) и "Домены 3-го уровня новые", в которые попадают невстретившиеся (ненайденные) ранее ни разу при выполнении Проекта адреса Сайтов и Доменов 3-го уровня.

    Для удобства работы с этими списками сделаны следующее две функции.


    1. Вручную отправить на Рубрикацию (на модуль +News) ссылки из списков

    На картинке ниже красная и зеленая стрелочки показывают пункты меню, выбрав которые можно применить данную функцию:





    2. Прописать в Проекте работу с Сайтами новыми и Доменами 3-го уровня новыми

    Чтобы не запоминать и не набирать на клавиатуре соответствующий оператор, его можно выбрать так, как показано на картинке ниже:



    Если операторы: ^^Сайты новые; или ^^Домены 3-го уровня новые; применены в теле Проекта, то Рубрикация будет выполнена для ссылок их этих списков, то есть для главных страниц сайтов и доменов 3-го уровня, а не для ссылок из списка "Ссылки новые".

    Допускается применение обоих операторов в одном Проекте.

    Поскольку, в общем случае, для главных страниц сайтов и доменов 3-го уровня выделение значимого контента программным образом не представляется возможным и целесообразным, их текстовый контент в новостную ленту помещается полностью, соответственно, и Рубрикация будет сделана по их полному текстовому содержанию.


    Доступно, начиная с SiteSputnik News версии 9.4.7.1 от 27.02.2018 г.


Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 872
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

    Доступно в SiteSputnik 9.5.7.3 от 12.03.2018:

    • В "Чистом потоке" (напомню, ЧП - это полнотекстовая новостная лента, в которую попадают контенты всех ссылок, собранных в Проекте) СайтСпутник отмечает галочкой контенты ссылок, которые попали хотя бы в одну Рубрику.

    Соотвественно, непопавшие ни в одну Рубрику ссылки галочкой не отмечаются.


    • Время Рубрикации - добавлено в "Статистика по Источникам текущая" для каждого Источника.


    • Время поиска и время Рубрикации - точность измерения до микросекунд, а не до секунд как было ранее, иначе на некоторых Источниках при исследовании может возникнуть большая погрешность.


  Вперед>>Страницы: 1 2 3 4 5 6 7 8 9 * 10 11
Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Разработчик СайтСпутник, документация, где скачать »   Мелочи