270 likes | 915 Views
Curve Fitting. Regression 데이터가 상당한 크기의 오차를 포함한 경우 데이터의 일반적인 경향을 나타내는 하나의 곡선을 유도해 내는 방법. Interpolation 데이타값이 매우 정확한 값으로 알려져 있어 각 데이터점들을 직접 통과하는 하나의 곡선으로 보간 하는 방법. Curve Fitting 의 두 가지 접근 방법. Least-squares regression. Linear regression - 최소제곱근사시 가장 간단한 형태 - 관측치에 대해 직선으로 적합
E N D
Curve Fitting 국민대학교 기계•자동차 공학부
Regression 데이터가 상당한 크기의 오차를 포함한 경우 데이터의 일반적인 경향을 나타내는 하나의 곡선을 유도해 내는 방법 Interpolation 데이타값이 매우 정확한 값으로 알려져 있어 각 데이터점들을 직접 통과하는 하나의 곡선으로 보간 하는 방법 Curve Fitting 의 두 가지 접근 방법 국민대학교 기계•자동차 공학부
Least-squares regression • Linear regression • - 최소제곱근사시 가장 간단한 형태 • - 관측치에 대해 직선으로 적합 • - 최적의 직선을 구하기 위해선 모든 주어진 • 데이터의 오차의 합을 최소화 시키는 것 국민대학교 기계•자동차 공학부
- ‘최적’적합을 위한 판별 조건 ( …부적절한 방법들) a) 오차의 합을 최소화 b) 오차의 절대값의 합을 최소화 c) 최소최대 판별 조건 : 직선으로부터 떨어진 각 점의 변위가 최소가 되도록 선택 - 측정된 y와 선형모델을 이용해 계산된 y사이의 잔차에 대한 제곱의 합을 최소화하는 방법이 고려 국민대학교 기계•자동차 공학부
- 정규방정식(Normal equation) 에서 과 를 구하기 위해 각각 편미분을 취하면 이므로 윗 식에 대입하면 2원 1차 연립방정식이 주어짐. 이를 풀면 국민대학교 기계•자동차 공학부
- Quantification of error of Linear Regression • 선형회귀분석의 잔차는 각 데이터 점과 직선내의 점과 수직거리를 나타낸다. b) 데이터와 직선과의 차이는 데이터의 전체 범위에 걸쳐 유사한 크기를 갖는다. 잔차의 제곱은 데이터와 또 다른 중심경향의 추정 값인 직선과의 수직거리의 제곱 잔차의 제곱은 데이터와 평균 사이의 차이의 제곱 국민대학교 기계•자동차 공학부
직선을 중심으로 한 데이터 점들의 분포는 정규분포를 이룬다. • 윗 사항을 이용, 오차의 정도를 산출해 낼 수 있다. 결정계수(Coefficient of determination) 상관계수(correlation coefficient) * 다만 컴퓨터의 응용을 위해서는 r에 대해서 다음과 같은 형태의 공식을 응용 하는 것이 편리! 국민대학교 기계•자동차 공학부
- 비선형관계식의 선형화 • 선형최소제곱에 부적합한 데이터가 있을 시 이를 비선형으로 표현할 필요가 있음. • 이에 따른 방법에는 다항식의 선형회귀분석이나 변환을 해서선형회귀분석에 용이하게 할 수 있음. 국민대학교 기계•자동차 공학부
Polynomial regression 데이터를 m차 다항식으로 확장한다면 잔차의 제곱합은 이다. 계수를 구하기 위해 각각 계수에 따른 편미분을 하고, 정규방정식을 구하면 다음과 같다. 이로써 연립방정식을 풀어, 각각의 계수를 구한다. 표준오차는 다음과 같이 나타낸다. 국민대학교 기계•자동차 공학부
Multiple linear regression • y가 두개 또는 그 이상의 변수를 갖는 선형 함수인 경우 • 두개 이상의 변수를 갖는 함수의 실험값을 보간 하는데 • 특히 유용 • 이러한 2차원인 경우 회귀분석 ‘선’은 ‘평면’이 됨. 국민대학교 기계•자동차 공학부
계수들의 ‘최적’값은 다음과 같은 잔차의 제곱합을 고려 • 편미분을 취해 편미분들이 0으로 될 때의 계수값을 결정 국민대학교 기계•자동차 공학부
Interpolation • Newton의 제차분보간다항식 • Linear Interpolation • 가장 간단한 형태의 보간법 • 두개의 점을 직선으로 연결 • 관계식 유도 국민대학교 기계•자동차 공학부
Quadratic Interpolation • 3개의 데이터 점이 있을 경우 2차 다항식으로 표현 • 윗 식을 정리하여 각 계수를 b항으로 나타내면 • 각각의 b값을 구하면 국민대학교 기계•자동차 공학부
Newton 보간다항식의 일반적인 형식 • (n+1)개의 데이터 점에 n차 다항식을 적합시키는 것으로 일반화 • n차 다항식 • 앞서서 한 것과 같이, 데이터 점들은 계수 bi을 구하는데 사용 국민대학교 기계•자동차 공학부
n차의 유한 제차분은 다음과 같이 표현 • 일반적인 보간 다항식 국민대학교 기계•자동차 공학부
Newton 보간다항식의 오차 • 함수의 고차거동을 따라 가기 위해서 연속적으로 항을 추가해 • 준다는 사실에서 Taylor급수전개와 유사 • Taylor급수에서처럼 절단오차에 대한 공식이 얻어짐. • (n+1)차 도함수를 근사하는 데 유한제차분을 아래와 사용하면 • 추가적인 데이터 점을 사용, 오차를 추정하는데 사용 국민대학교 기계•자동차 공학부
Lagrange 보간다항식 • Newton 다항식을 간단하게 공식화 여기서 • 예를 들어 국민대학교 기계•자동차 공학부
에서 각 항 는 1이 • 되고 모든 다른 점에서는 • 0 임 • 그러므로 각각의 곱인 • 는 에서 인 값을 가짐 • 즉 모든 곱들의 합은 모든 개의 • 데이터 점들을 정확히 지나는 차 • 다항식이 됨 국민대학교 기계•자동차 공학부
Spline 보간법 • 앞장의 함수는 절단오차 및 • 초과등으로 인해 잘못된 • 결과를 이끌어 낼 수 있음 • Spline function : • 데이터 점들의 부분집합에 • 저차다항식을 적용시키는 • 것 국민대학교 기계•자동차 공학부
Linear Splines • 두 점을 가장 간단하게 연결시키는 것은 직선 • 정돈된 데이터 점들에 대한 1차 스플라인은 선형함수의 • 집합으로 정의 • 여기서 mi는 점들을 연결해 주는 직선의 기울기임 국민대학교 기계•자동차 공학부
Quadratic Splines • m차 도함수가 교점에서 연속하기 위해서 적어도 (m+1)차의 • 스플라인이 사용되어야 함 • 데이터 점들 사이의 각 구간마다 각 2차 다항식을 유도 • n+1개의 데이터 점들에는 n개의 구간이 존재하며, 3n개의 미지수 • 들이 결정 되어야 함. 국민대학교 기계•자동차 공학부
미지수 계산 방법 • a) 이웃하는 다항식들의 함수 값은 내부 절점에서 같은 값 • b) 첫번째와 마지막 함수는 반드시 끝점을 통과해야 함. • c) 내부 절점에서 1차 도함수는 같아야만 한다 • d) 2차 도함수는 첫번째 데이터 점에서 0이라고 가정, 즉 처음 • 두개의 점은 직선! 국민대학교 기계•자동차 공학부
Cubic Splines • 데이터 점들 사이의 각 구간마다 각 3차 다항식을 유도 • n+1개의 데이터 점들에는 n개의 구간이 존재하며, 4n개의 미지수 • 들이 결정 되어야 함. • - 미지수 결정법 a) 이웃하는 다항식들의 함수 값은 내부 절점에서 같은 값 b) 첫번째와 마지막 함수는 반드시 끝점을 통과해야 함. c) 내부 절점에서 1차 도함수는 같아야 한다 d) 내부 절점에서 2차 도함수는 같아야 한다 e) 2차 도함수는 첫번째 데이터 점에서 0이라고 가정, 즉 처음 두개의 점은 직선! 국민대학교 기계•자동차 공학부