Перейти к содержанию

Разведочный анализ данных (EDA) картинок:

Ноутбук с анализом

1. Анализ характеристик изображений:

  • Количество изображений в датасете: 3373
  • Средняя ширина: 253
  • Средняя высота: 204
  • Минимальная ширина: 139
  • Минимальная высота: 111
  • Максимальная ширина: 453
  • Максимальная высота: 363
  • Средние значение во всем датасете: Red = 167.49, Green = 145.87, Blue = 110.35
  • Стандартные отклонения во всем датасете : Red = 56.51, Green = 60.39, Blue = 66.75

Apple

- Средние значение в классе Apple: Red 183.53, Green 144.32, Blue 123.59
- Стандартные отклонения в классе Apple: Red 53.0, Green 70.51, Blue 73.84

avocado

- Средние значение в классе avocado: Red 144.07, Green 145.66, Blue 109.77
- Стандартные отклонения в классе avocado: Red 62.61, Green 60.68, Blue 64.23

Banana

- Средние значение в классе Banana: Red 170.9, Green 163.83, Blue 111.9
- Стандартные отклонения в классе Banana: Red 50.74, Green 51.3, Blue 63.15

cherry

- Средние значение в классе cherry: Red 148.08, Green 122.83, Blue 106.32
- Стандартные отклонения в классе cherry: Red 59.74, Green 69.48, Blue 67.29

kiwi

- Средние значение в классе kiwi: Red 164.84, Green 158.31, Blue 113.52
- Стандартные отклонения в классе kiwi: Red 53.6, Green 55.48, Blue 66.88

mango

- Средние значение в классе mango: Red 166.42, Green 140.7, Blue 87.47
- Стандартные отклонения в классе mango: Red 58.27, Green 56.56, Blue 61.11

orange

- Средние значение в классе orange: Red 187.23, Green 153.04, Blue 102.27
- Стандартные отклонения в классе orange: Red 49.75, Green 52.41, Blue 70.62

pinenapple

- Средние значение в классе pinenapple: Red 162.35, Green 155.99, Blue 123.96
- Стандартные отклонения в классе pinenapple: Red 57.97, Green 55.25, Blue 64.36

strawberries

- Средние значение в классе strawberries: Red 166.06, Green 112.25, Blue 92.4
- Стандартные отклонения в классе strawberries: Red 57.0, Green 66.3, Blue 63.0

watermelon

- Средние значение в классе watermelon: Red 159.38, Green 139.74, Blue 113.63
- Стандартные отклонения в классе watermelon: Red 61.3, Green 63.3, Blue 65.7

2. Изучение связи изображений с целевой переменной и визуализация данных:

  • Наша тренировочный датасет состоит из 10 классов: Apple, avocado, Banana, cherry, kiwi, mango, orange, pinenapple, strawberries, watermelon.
  • Каждый класс включает в себя 210 изображений.
  • В классах cherry и strawberries преобладает красный цвет, в orange - желтый цвет, в других классах явного преобладания определенного цвета визуально замечено не было.
  • Дисбаланса классов не выявлено. Датасет хорошо сбалансирован.
  • Метаданные в изображениях отсутствуют.