Перейти к основному содержимому
Перейти к основному содержимому

varSamp

varSamp

Вычисление выборочной дисперсии набора данных.

Синтаксис

varSamp(x)

Псевдоним: VAR_SAMP.

Параметры

  • x: Популяция, для которой вы хотите вычислить выборочную дисперсию. (U)Int*, Float*, Decimal*.

Возвращаемое значение

  • Возвращает выборочную дисперсию входного набора данных x. Float64.

Детали реализации

Функция varSamp вычисляет выборочную дисперсию, используя следующую формулу:

(xmean(x))2(n1)\sum\frac{(x - \text{mean}(x))^2}{(n - 1)}

Где:

  • x - это каждое отдельное значение в наборе данных.
  • mean(x) - арифметическое среднее значение набора данных.
  • n - количество значений в наборе данных.

Функция предполагает, что входной набор данных представляет собой выборку из более крупной популяции. Если вы хотите вычислить дисперсию всей популяции (когда у вас есть полный набор данных), вам следует использовать varPop вместо этого.

Пример

Запрос:

DROP TABLE IF EXISTS test_data;
CREATE TABLE test_data
(
    x Float64
)
ENGINE = Memory;

INSERT INTO test_data VALUES (10.5), (12.3), (9.8), (11.2), (10.7);

SELECT round(varSamp(x),3) AS var_samp FROM test_data;

Ответ:

┌─var_samp─┐
│    0.865 │
└──────────┘