ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [R 학습일지, 1일차] R, 통계분석용 언어 특징, 기초통계량
    컴퓨터, AI/R (통계) 2026. 4. 20. 17:34

    4월20일(월) R 수업내용 구조화하기 (coggle 이용해서 마인드맵 트리구조 만들기)

     

    코글을 이용한 마인드

    R의 특징

     

    R의 벡터화 연산

     

    ▶ 통계하면 가장 먼저 생각나는 단어는? 평균

    ▶ 왜 평균을 사용할까? → 데이터를 단순화 시켜서 비교하기 위함이다. (데이터를 열로 비교한다)

     

    R의 벡터화 연산

    ▶ 열을 우선으로 취급한다

    (행보다 열로 작업하면 작업속도가 5배에서 10배 빨라진다)

    → 분산 : 데이터가 평균으로부터 얼마나 분산되어 있는지?

    분산이 크면 중요한 지표이다, why? 분석의 대상, 그 집단의 특성을 찾을 수 있기 때문

    🚩C, Java, Python 은 행우선이다

     

    데이터를 연속적인 공간에 저장한다

    1) 동질적 데이터만을 저장 가능

    2) 연속적 데이터를 저장할 수 있다.

    🚩C의 배열(array), Numpy와 동일하다

     

     

     

     

    1) R에는 데이터 타입이 없다

    2) 변수가 주소다

    3) Call by reference이긴 하지만, 공유할때 복사하지 않음

    그러면? 

    수정 후 복사

    수정을 다 하면 복사한다 → 원본에 무영향

    🚩 데이터 보호를 위함

     

     

     

    <기초 통계량>

    • 중심 경향

    1) 평균(mean)

    • 모든 관측값을 더해서 개수로 나눈 값
    • 데이터의 '중심'
    • 퍼짐 정도(산포도)

    2) 분산(variance)

    • 데이터가 평균으로부터 얼마나 멀리 퍼져있는지 나타냄
    • 각 값에서 평균을 뺀 뒤 제곱해서 합산한다

    3) 표준편차 (Standard Deviation)

    • 분산에 √루트를 씌운 값
    • 실제 데이터와 같은 단위로 퍼짐 정도를 보여준다
    • 상대적 비교

    4)변동계수 (Coefiicient of Variation, CV)

    • 서로 단위가 다른 두 집단의 퍼짐 정도를 비교
    • 표준 편차를 편차를 평균으로 나눈 값
Designed by Tistory.