Методологія

КРОК 1

П'ятірка найпопулярніших CPV-кодів, за якими купують цей товар інші замовники. Майте на увазі, шо пошук відбирає не тендери, а діючі контракти

КРОК 2

Кожен місяць на популярні товари відбуваються сотні, а то й тисячи тендерів. Щоб зробити навігацію по них більш зручною, ми використовуємо сортування за п'ятьма критеріями. Перші три - показники з бази даних ProZorro, два останніх - агреговані показники (про них більш детально нижче):

  1. Конкуренція
  2. Економія
  3. Сума закупівлі
  4. Підготовка тендеру і робота з учасниками
  5. Характеристика переможця

Кожен критерій нормалізується (приводиться в діапазон від 0 до 1). Для конкуренції, підготовки тендеру та характеристики переможця одиниця - найкращий результат. В той же час для економії та суми закупівлі - це не завжди так. Наприклад, економія в 0%, ймовірно, так само погано, як і економія більше 50% (що, вірогідно, свідчить про неякісно визначену очікувану вартість). Щоб вирішити цю проблему ми використовуємо метод машинного навчання K-MEANS розбиваємо вибірку на кластери, знаходимо кластер з найбільшою конкуренцією і дивимось, які йому притаманні показники економії та суми. Вони стануть еталонними значеннями для цих двох показників замість одиниці.

Далі ми використовуємо Евклідову метрику, щоб знайти відстань по кожному із п'яти критеріїв до найкращого результату. За аналогією це схоже на радар чи кругові хвилі на воді, які розходяться навколо місця, куди у воду кинули камінець, захоплюючи найближчі точки - але тільки у багатовимірному просторі. Також ви можете думати про це, як про табличку в екселі - уявіть, що ви змогли б одночасно її відсортувати за п’ятьма колонками/параметрами. При цьому Евклідова метрика, а не просто сума балів по всіх колонках, гарантує, що на горі опиняться тендери, де більш менш однаково рівні і високі усі п'ять показників.

В кінцевому рахунку ми отримуємо тендери з найкращою конкуренцією, економією, ціною, кращою практикою роботи з постачальниками та переможцями.

Пояснення агрегованих показників:

4. Підготовка тендеру і робота з учасниками

За кожну ствердну відповідь на одне з десяти питань нижче присвоюється один бал. Максимум 10 балів.
  1. Не було дискваліфікацій, як на етапі подання документів (для євроторгів), так і на етапі визначення переможця
  2. Конкурентна процедура
  3. Один лот в закупівлі
  4. Один "айтем" в закупівлі (краща практика не робити "багатоайтемні" закупівлі)
  5. Не має питань учасників до замовника, які він лишив без відповіді у системі Prozorro
  6. Не було скарг чи вимог до замовника від учасників
  7. Сума закупівлі не потрапляє в діапазон 195-200 тис. грн. (можливе маніпулювання процедурою закупівлі. Див. детальніше статтю)
  8. Вказана кількість товарів не дорівнює "1"
  9. Не було змін тендрної документації після оголошення тендеру
  10. Обраний CPV-код є першим чи другим за популярністю для цього товару

5. Характеристика переможця

За кожну ствердну відповідь на питання нижче присвоюється один бал. Максимум 5 балів.
  1. Контактні дані переможця тендеру заповнені?
  2. У переможця тендеру це не перша перемога у Prozorro?
  3. Переможець тендеру не зареєстрований в поточному році?
  4. Не було дадаткових угод по підвищенню ціни у вибраний період?
  5. Форма власності (ФОП, ТОВ, тощо) переможця тендеру є найбільш розповсюдженою на цьому ринку?

Q&A

  • Чому не можна задати критерії для сортування самостійно наперед?
    Для кожного товару не можна наперед зазначити, яка сума є великою,а яка ні, що вважати нормальною економією чи конкуренцією. Наприклад, 50 тис грн для закупівлі пального - це невелика сума. Але для закупівлі яєць - велика. Деякі ринки дуже конкурентні, а деякі - ні. Ми намагаємось не вводити ніякі обмеження ні по сумі, ні по економії, ні по інших показниках - все це визначають машинні алгоритми.
  • Чому не можна відібрати ці дані з пошуку на головній сторінці Prozorro?
    В пошуку Prozorro не має вимірювань економії чи конкуренції, тощо, а сортування відбувається лише за датою
  • Навіщо розбивати з початку на кластери. Чому одразу не можна знайти тендери, в яких усі 5 показників найвищі?
    Це допомагає уникнути випадків, коли, наприклад, на перших місцях будуть тендери з великою економією і невеликою конкуренцією. Скажімо, тендер з конкуренцією 2 і економією 70% не можна вважати кращим за, наприклад, 4 учасника і економію 15%, так як, швидше за все, у першому випадку мова йде про неправильно встановлену стартову ціну. Тому на першому етапі треба використовувати k-means, щоб підібрати кластери і знайти той, де найкращий центр тяги за кількістю учасників. Решта його опорних точок і будуть потім еталонними значеннями для економії та суми закупівлі, від яких наш "радар" буде рухатися одночасно в різні боки, визначаючи пріорітет відображення закупівель в таблиці.
  • Навіщо використовувати Евклідову відстань, чому не можна просто сортувати за сумою балів усіх параметрів?
    Евклідова відстань (Евклідова метрика) — формула відстані між двома точками. Вона гарантує, що на горі опиняться тендери, де більш менш рівно високі усі п'ять показників. Для прикладу, два показника по 50% від еталону будуть кращими ніж, скажімо, 10 та 90%, хоча якщо їх просто додати один до одного вони будуть однаковими.

КРОК 3

Список вимог участників до замовника та скарг учасників до Антимонопольного комітету, які стосуються тендерної документації

КРОК 4

ТОП-10 переможців за кількістю укладений у відповідний період контрактів.

Контрактів на одного замовника - свіввідношення загальної кількості контрактів і контрактів з унікальними замовниками:
Середня конкуренція - середня конкуренція на всіх тендерах переможця.
Середня економія - середня економія на всіх тендерах переможця.
Змінені контракти - Відсоток контрактів, які були змінені в частині підвищення ціни через механізм додаткових угод.

КРОК 5

Проблема визначення ціни з даних Prozorro полягає в тому, що в них є тільки загальна сума контракту та кількість придбаного товару без розбивки на специфікації (наприклад, пальне чи овочі). Щоб знайти орієнтовні цінові діапазони на конкретні товари спершу ми "чистимо" дані:

1. Відбираємо тендери, де один лот, вказані одиниці придбаного товару, а сама закупівля є одноайтемною - тобто такою, де в одному лоті лише один вид товару (так ми знаємо, що купується не "збірна солянка", а конкретний продукт).

2. Навіть в одноайтемних тендерах може бути приховано декілька видів товару, тому ми визначаємо так це чи ні, підраховуючи, як часто зустрічається в описі айтему слово одиниць товару (наприклад, "...картопля кілограм, морква кілограм, буряк кілограм..." - одиниці виміру зустрічаються три рази)

3. Всі ціни розполідяються на діапазони, визначені автоматично в залежності від суми (для палива це, наприклад, 2 грн, для паперу - 5 грн, для природного газу - 500 грн. Всі ціни в цьому діапазоні автоматично будуть потрапляти до нього). Для побудови цінового графіка умовою є те, що мода (найвищий стовбець в ціновому коридорі) складає не менше 25% всієї вибірки. В іншому випадку ви побачите сповіщення на екрані: "Дані дуже не структуровані".

4. Якщо у вибірці залишиться не менше 50 контрактів, буде побудований графік та відображений найбільш популярний проміжок ціни. В іншому випадку ви побачите сповіщення на екрані: "Замало даних для визначення ціни".

Звичайно, ціновий графік є приблизним, але він дає досить точне уявлення про цінову ситуацію на ринку.

Ви можете надсилати свої зауваження щодо сервісу та методології на наш e-mail: [email protected]