Разведочный анализ данных (EDA) картинок:
Ноутбук с анализом
1. Анализ характеристик изображений:
- Количество изображений в датасете: 3373
- Средняя ширина: 253
- Средняя высота: 204
- Минимальная ширина: 139
- Минимальная высота: 111
- Максимальная ширина: 453
- Максимальная высота: 363
- Средние значение во всем датасете: Red = 167.49, Green = 145.87, Blue = 110.35
- Стандартные отклонения во всем датасете : Red = 56.51, Green = 60.39, Blue = 66.75
Apple
- Средние значение в классе Apple: Red 183.53, Green 144.32, Blue 123.59
- Стандартные отклонения в классе Apple: Red 53.0, Green 70.51, Blue 73.84
avocado
- Средние значение в классе avocado: Red 144.07, Green 145.66, Blue 109.77
- Стандартные отклонения в классе avocado: Red 62.61, Green 60.68, Blue 64.23
Banana
- Средние значение в классе Banana: Red 170.9, Green 163.83, Blue 111.9
- Стандартные отклонения в классе Banana: Red 50.74, Green 51.3, Blue 63.15
cherry
- Средние значение в классе cherry: Red 148.08, Green 122.83, Blue 106.32
- Стандартные отклонения в классе cherry: Red 59.74, Green 69.48, Blue 67.29
kiwi
- Средние значение в классе kiwi: Red 164.84, Green 158.31, Blue 113.52
- Стандартные отклонения в классе kiwi: Red 53.6, Green 55.48, Blue 66.88
mango
- Средние значение в классе mango: Red 166.42, Green 140.7, Blue 87.47
- Стандартные отклонения в классе mango: Red 58.27, Green 56.56, Blue 61.11
orange
- Средние значение в классе orange: Red 187.23, Green 153.04, Blue 102.27
- Стандартные отклонения в классе orange: Red 49.75, Green 52.41, Blue 70.62
pinenapple
- Средние значение в классе pinenapple: Red 162.35, Green 155.99, Blue 123.96
- Стандартные отклонения в классе pinenapple: Red 57.97, Green 55.25, Blue 64.36
strawberries
- Средние значение в классе strawberries: Red 166.06, Green 112.25, Blue 92.4
- Стандартные отклонения в классе strawberries: Red 57.0, Green 66.3, Blue 63.0
watermelon
- Средние значение в классе watermelon: Red 159.38, Green 139.74, Blue 113.63
- Стандартные отклонения в классе watermelon: Red 61.3, Green 63.3, Blue 65.7
2. Изучение связи изображений с целевой переменной и визуализация данных:
- Наша тренировочный датасет состоит из 10 классов: Apple, avocado, Banana, cherry, kiwi, mango, orange, pinenapple, strawberries, watermelon.
- Каждый класс включает в себя 210 изображений.
- В классах cherry и strawberries преобладает красный цвет, в orange - желтый цвет, в других классах явного преобладания определенного цвета визуально замечено не было.
- Дисбаланса классов не выявлено. Датасет хорошо сбалансирован.
- Метаданные в изображениях отсутствуют.