При проведении анализа данных часто на практике необходимо оценить зависимости между парами соответствующих элементов, например, вариация размера отверстия в зависимости от скорости вращения сверла, скорость вращения токарного станка и размер детали. Для этого используют диаграммы рассеивания, позволяющие без математической обработки данных установить зависимости по графическому представлению. Таким образом, данный статистический инструмент может быть использован линейным персоналом и менеджментом.
Данная диаграмма позволяет установить зависимости для
- двух различных характеристик качества
- двух факторов, влияющих на одну и ту же характеристику качества
- характеристик качества процесса и фактора, влияющего на ход процесса
Для понимания связи между выбранными параметрами необходимо построить диаграмму рассеивания и понять ситуацию в целом.
Построение диаграммы:
- Собрать парные данные x и y между которыми необходимо исследовать зависимость. Парных данных должно быть не меньше 35.
- Найти максимальное и минимальное значение для x и y. Выбрать шкалы на горизонтальной и вертикальной оси так, чтобы изменение факторов по осям приходилось на отрезки примерно одинаковой длины для удобства чтения диаграммы. При анализе влияния фактора на параметр качества по оси OX обычно располагают значения фактора, а по OY – параметра качества.
- Построить график и нанести на него данные. Если парные данные повторяются дважды, то рядом рисуются две точки, или кружок
- Нанести на диаграмму все необходимые обозначения:
- интервала времени
- число данных
- название и единицы измерения
- имя, должность, человека, строящего диаграмму и оператора, собиравшего данные для диаграммы.
Пример:
При процессе выпуска литьевых поддонов багажника компания сталкивается с проблемой при литье под давлением. Было высказано предположение, что причина тонких стенок поддонов, приводящих для конечного клиента к быстрому истиранию и повреждению заключается в вариации давления сжатого воздуха, которое меняется каждый день.
Было принято решение провести анализ и установить наличие или отсутствие данной зависимости (Рис.1).
Собраны данные за один месяц. Технология литья непрерывная, без выходных
Рис.1
Чтение диаграммы рассеивания
По диаграмме рассеивания можно судить о об общем распределении пар чисел. Для этого необходимо, во-первых, выяснить если ли далеко отстоящие точки – они являются выбросами. Если есть далеко отстоящие точки, то их надо исключить из корреляционного анализа, но пренебрегать ими нельзя. Стоит обратить на них внимание, так как причиной выброса могут не только неверно занесённые данные, но внутренние причины процесса, которые могут дать полезную информацию (Рис.2).
Рис.2
- Прямая корреляция
- Слабая прямая корреляция
- Обратная корреляция
- Слабая обратная корреляция
- Отсутствие корреляции
- Криволинейная корреляция
- Слабая криволинейная корреляция
Для изучения связи между x и y необходимо вычислить коэффициент корреляции r.
Число n – число пар данных
S(xy) – ковариация – мера линейной зависимости двух случайных величин.
r ∈ [-1;1]
- Если значение r > 1, то есть ошибка и необходимо пересчитать результат
- При r → 1 сильная положительная зависимость
- При r → -1 сильная отрицательная зависимость
- При |r| ≈ 1 сильная зависимость
- При r → 0 слабая зависимость
- При r = 0 зависимости может и не быть
- При r = 1 все точки диаграммы лежат на одной прямой, есть зависимость