SiteSputnik. Документы, файлы, списки, таблицы
SiteSputnik. и другая выдача программы
Автор
Алексей Мыльников
Дата выхода публикации - 19.06.18г.     
Последнее изменение - 04.07.18г.     



Аннотация
    В данной публикации собрана основная выдача, создаваемая программой SiteSputnik.


Перечень документов, файлов, списков, таблиц
    Название файла - его назначение ... .

  1. Пакет, проект - текст выполняемого задания, а именно: простого запроса, пакета запросов или одного из видов или типов Проекта.

  2. URL-источников - список адресов всех задействованных в Проекте ссылок, из контента которых выбираются найденные ссылки.

  3. Экспорт-txt - список в виде текстового документа адресов всех найденных ссылок в Проекте.

  4. Экспорт-htm - список в виде html-документа адресов всех найденных ссылок в Проекте.

  5. Объединение - список в виде сниппетов всех найденных ссылок в Проекте.

  6. Ссылки новые - список в виде сниппетов всех новых уникальных ссылок, точнее тех ссылок, которые не встречались ещё ни разу ни в одном из предыдущих выполнений Проекта (впервые найденные ссылки).

  7. Сайты новые - список только новых уникальных сайтов, ссылки с которыx не встречались ещё ни разу ни в одном из предыдущих выполнений Проекта (впервые найденные сайты).

  8. Домены 3-го уровня новые - список только новых уникальных доменов 3-го уровня, ссылки с которых не встречались ещё ни разу ни в одном из предыдущих выполнений Проекта (впервые найденные домены 3-го уровня).

  9. Ссылки открытые - список в виде сниппетов тех ссылок, которые хотя бы один раз были ранее открыты или скачаны в Проекте.

  10. Общие - список в виде сиппетов ссылок, которые были найдены абсолютно всеми источниками, задействованными в Проекте. Создается, если такие ссылки обнаружены.

  11. Все сниппеты - если ссылка была найдена несколькими источниками, то сниппеты из разных источников для каждой ссылки объединяются в один большой общий сниппет.
          Удобно, в частности, еcли ссылка была удалена и её содержание ищется в Кэш.
  12. Заголовки - перечислены только заголовки и адреса ссылок (упрощенные сниппеты). Применимо практически для всех описанных и выше, и ниже документов.

  13. Выдача источника - для каждого источника его выдача может быть сохранена в отдельном файле.

  14. Аналитическое объединение - несколько списков Объединение (или списков Новые) объединяются в один список.
          Чем в большем количестве объединяемых списков присутствует ссылка, тем ближе к началу результирующего списка она расположена!
  15. Разность - из одного списка удаляются ссылки, присутствующие в другом списке.

  16. Карты - иерархическая структура из адресов ссылок, найденных в Проекте (несколько деревьев).
          Также в отдельных файлах создается папочная, ресурсная и доменная структура web-пространства, попавшего в Проект.
  17. Карта сайта - иерархическая структура из принадлежащих сайту адресов ссылок, найденных в интернете.
          Обращения к самому сайту не выполняются, выполняются только запросы в поисковиках. Материализация видимого интернета.
  18. RSS-потоки все - список всех RSS-потоков, адреса которых размещены на открываемых или скачиваемых страницах в Проекте.

  19. RSS-потоки новые - список только тех RSS-потоков, которые не встречались ещё ни разу ранее при выполнении Проекта.

  20. RSS-потоки новые+ - список только тех RSS-потоков новых, контент которых содержит заданную ключевую фразу.

  21. URL-ссылки все - список всех ссылок, скачанных или размещенных в контенте скачанных, удовлетворяющих фильтру.

  22. URL-ссылки новые - список тех URL-ссылок, которые не встречались ещё ранее.

  23. URL-потоки новые - потоки ссылок или сниппетов, несущие URL-ссылки новые (это не RSS-потоки).

  24. URL-потоки новые+ - список только тех URL-потоков новых, контент которых содержит заданную ключевую фразу.

  25. Статистика по Источникам текущая (зеленая табличка) - показывает в абсолютном и процентном выражении эффективность работы каждого источника, а именно: сколько найдено им ссылок всего, сколько новых, сколько попавших в рубрики.

  26. Статистика по Источникам обобщенная (голубая табличка) - показывает "усредненную" эффективность работы источников из текущего Проекта, опираясь на Статистики текущие.

  27. Статистика по Источникам полная (розовая табличка) - показывает "усредненную" эффективность работы всех когда-либо примененных в Проекте источников.

  28. Замечание: Все текущие статистики (п.25,28-31) могут быть представлены в xlsx-формате и выгружены во внешнюю папку.

  29. Статистика по Рубрикам текущая сокращенная - показывает сколько ссылок попало в каждую Рубрику при текущем выполнении Проекта.


  30. Статистика по Рубрикам+Источники+их домены текущая - показывает сколько ссылок попало в Рубрику в разрезе Рубрика-Источник.

  31. Статистика по Рубрикам+Домены Ссылки текущая - показывает сколько ссылок попало в Рубрику в разрезе Рубрика-Домен ссылки.

  32. Статистика по Рубрикам текущая расширенная - самые подробные сведения о Рубриках, Источниках, доменах ссылки и источника, ссылках, ... задействованных в Проекте.

  33. Статистика по Рубрикам (желтая табличка) - показывает когда и сколько ссылок попало в каждую Рубрику (история заполнения Рубрик для заданного количества Пректов).

  34. График по статистике - графическое отображение Статистики по Рубрикам. Пример инфографики для Проекта "Финансы"

  35. Сигнализация - табличка для Статистики по Рубрикам, описывающая условия возникновения сигнала.

  36. Чистый поток - полнотекстовая лента из очищенных от мусора контентов всех ссылок, найденных и скачанных в Проекте.

  37. Символьный поток - полнотекстовая лента из необработанных контентов всех ссылок, найденных и скачанных в Проекте.

  38. Повторные - дубли контентов из Чистого потока перемещаются в этот документ.

  39. Все комментарии - лента из комментариев, написанных к ссылкам из Чистого потока.

  40. Рубрика (Всё по Рубрике) - выборка из Чистого потока или из Все комментарии, удовлетворяющая правилам попадания в Рубрику.

  41. Пост-запрос - специальная рабочая Рубрика. Её правила прописываются не в иерархии Рубрик, а в настройках. Применяется и для +WebSpider, и для +News.

  42. Рубрика-ссылки - перечислены все Рубрики, задействанные в Проекте, и для каждой Рубрики перечислены все попавшие в неё ссылки.

  43. Ссылка-Рубрики - перечислены все ссылки, найденные в Проекте, и для каждой ссылки перечислены Рубрики, в которые она попала.

  44. Неоткрывшиеся - перечислены все ссылки, которые не удалось после нескольких попыток открыть или скачать на любом этапе выполнения Проекта.

  45. Невидимые - перечислены отсутствующие в поисковиках, но существующие и найденные методами поиска в невидимом интернете ссылки сайта.

  46. Подсвеченные зеленым фразы - могут быть выведены в отдельный одноименный файл.

  47. Упоминание объектов - список ЮЛ и ФЛ, присутствующих на самых релевантных ссылках, вычисленных при сборе информации об объекте, и количество их упоминаний.

  48. Tаблица-htm - табличное представление документа в виде html-таблички (доступно для многих документов из этого списка).

  49. Таблица-xls - табличное представление документа в виде Excel-таблички (доступно для Рубрик и Чистых потоков).

  50. JSON-файл - представление документа в json-формате (доступно для Рубрик и Чистых потоков).

  51. Локальный файл - практически любой документ может быть отправлен в любое количество папок локальной сети.

  52. Web-файл - практически любой документ может быть отправлен в любое количество папок заданного сайта.

  53. E-mail-файл - практически любой документ может быть отправлен по заданным электронным почтовым адресам.

  54. Проект главный - полный текст проекта, связанный с текущей папкой (текущим ящиком). Он хранится в библиотеке готовых проектов.

  55. Проект расширенный - содержит автоматически обнаруженные и автоматически подключенные источники вида RSS-потоки и URL-потоки, приносящие информацию в Рубрики.

  56. Проект проверочный - текст проекта, содержащий источники-кандидаты на попадание в проект расширенный.

  57. Проект исполняемый - текст проекта, который выполнен. Может совпадать с главным, проверочным, расширенным проектом или получен из пакета с параметрами.

  58. Журнал ошибок и предупреждений - все ошибки, предупреждения и замечания по работе Проекта - в одном месте.

  59. Практически любая выдача программы может быть сохранена как документ в формате PDF, DOCX, RTF, TXT, MHT, HTM или конвертирована в формат xlsx и json.



Экспорт документов
Вся выдача программы СайтСпутник, перечисленная в данной публикации, доступна для других Приложений (программ).


Список литературы.
Полный список публикаций о программе собран на этой странице http://sitesputnik.ru/Public.htm.
Сайт о программе - http://sitesputnik.ru/.
Скачать программу можно отсюда.


Copyright © Автор ИП Мыльников Алексей Борисович, г. Волгоград, 2018. Все права защищены.