20221020
11일차
Numpy의 array도 데이터 타입의 한 종류이기 때문에 연산이 가능하고 더 다양하다.
총 3개의 array를 만들어 연산을 해보자.
Numpy에서는 기본적인 사칙연산은 위와 같이 두 가지 방법으로 연산이 가능하다.
* 중요한점은 배열이 같은 것 끼리 가능하다. 다르면 Error
빼기로 나온 값이 음수로 출력되기도 한다.
리스트 타입이나 숫자타입에서는 볼 수 없었던
지수곱 표현이 등장했다.
수리적인 지식이 많이 부족하다는것을 느낀다.
제곱근 또한 가능하다.
행렬곱은 일반 곱이랑 다른데
그냥 a * b의 결과는 위 사진과 같지만
메서드로 행렬곱을 쓰면 행렬끼리 곱하는 계산이 적용된다.
그냥 a와 b를 비교한다면 True와 False로 표기된다.
하지만 메서드를 쓰면
완전히 일치하는지 여부만 체크하여 하나의 결과만 보여준다.
Numpy로 집계 함수를 적용할 때는 무조건 Axis를 기준으로 적용한다.
Axis = none 이면 전체 데이터를 하나의 범위로.
Axis = 0 이면 열을 기준으로 동일한 열에 있는 요소를 하나의 범위로.
Axis = 1 이면 행을 기준으로 동일한 행에 있는 요소를 하나의 범위로 지정한다.
이제 집계 함수를 알아보자.
항상 객체를 확인하고
위와 같이 두 가지 방식으로 결과를 도출할 수 있다.
Axis를 활용하여 가로축별, 세로축별 합산의 결과를 확인할 수 있다.
최소값을 구하는 메서드와 함수이다.
파이썬에서도 최소값을 구하는 메서드가 있는데
몰라서 백준문제 풀때 힘들었다.
Axis를 활용하여 가로축별, 세로축별 최소값의 결과를 확인할 수 있다.
최대값 또한 마찬가지이다.
누적 합계는 자료형 안의 값을 0번부터 누적해서 더해준 값을 표시한다.
평균은 배열 안의 값의 평균을 나타낸다.
* 중앙값은 Numpy 함수로만 쓸 수 있다!
* 자기 자신과의 상관관계는 항상 1이다.
3개 이상의 자료를 비교하여 상관계수를 구할 수는 없다.
표준편차를 구할 수 있다.
브로드캐스팅이란
배열이 다른 자료에 연산을 할때 배열을 맞추기 위해 늘리는 것이다.
위의 사진과 같이 배열이 다른것끼리 계산하더라도
같은 값이 나오는것을 알 수 있다.
스칼라 값으로 연산하고자 할때
같은 배열에 같은 수로 채워진다.
만약 서로 다른 구조의 배열이면 어떻게 연산을 수행해야 할까?
먼저 하나하나 새로운 배열을 생성해서
빈공간을 맞춰주고
계산하면 된다.
'Hello python! > Python_DA' 카테고리의 다른 글
파이썬 데이터분석_pandas_DataFrame (0) | 2022.10.29 |
---|---|
파이썬 데이터분석_Pandas_Series 자료형 (0) | 2022.10.23 |
파이썬 데이터분석_numpy변환(정렬, 참조, 복사)2 (0) | 2022.10.23 |
파이썬 데이터분석_numpy변환(정렬, 참조, 복사) (0) | 2022.10.22 |
파이썬 데이터분석_Numpy (0) | 2022.10.19 |