46 2 6MB
Cuprins Algebră 1.
Matrice de ordin doi şi aplicaţii (I.Diaconu, V.Pop) 1.1. Matrice de ordin doi 1.2. Probleme rezolvate 1.3. Teorema lui Cayley- Hamilton 1.4. Probleme rezolvate 1.5. Determinarea puterilor naturale ale unei matrice de ordin doi 1.6. Probleme rezolvate 1.7. Determinarea şirurilor reconcurente omografice şi ecuaţii diofantice de tip Pell 1.8. Probleme rezolvate 1.9. Ecuaţii matriciale binome în M2 (C) 1.10. Probleme rezolvate 2.
Matrice de ordin n. Valori şi vectori proprii (I.Diaconu, V.Pop) 2.1. Valori proprii si vectori proprii pentru matrice patratice 2.2. Polinom caracteristic al unei matrice patratice 2.3. Probleme rezolvate 2.4. Teorema lui Cayley- Hamilton 2.5. Teorema lui Frobenius 2.6. Probleme rezolvate
3.
Transformări elementare în matrice (I.Diaconu, V.Pop) 3.1. Transformări elementare 3.2. Calculul rangului unei matrice prin transformări elementare 3.3. Calculul inversei unei matrice prin transformări elementare 3.4. Probleme rezolvate
4.
Matrice de ordin doi şi trei ca transformări geometrice în plan şi spaţiu (I.Diaconu, V.Pop) 4.1. Aplicaţii liniare 4.2. Matricea asociată unei transformări 4.3. Proiecţii în plan şi spaţiu 4.4. Simetrii în plan şi spaţiu 4.5. Izometrii în plan şi spaţiu 4.6. Probleme rezolvate 5. Determinanţi (I.Diaconu, V.Pop) 5.1. Permutari 5.2. Probleme rezolvate 5.3. Determinanti de ordin n. Determinanti speciali 5.4. Probleme rezolvate 5.5. Functii polinominale de tip determinant 5.6. Probleme rezolvate 5.7. Derivata unui determinant
1
Analiză 1. Mulţimi dense (Gh. Boroica) 2. Subşir. Şir fundamental. Criterii de convergenţă (I. Magdaş) 2.1. Subşir al unui şir 2.2. Şir fundamental. Criteriul lui Cauchy 2.3. Criterii de convergenţă 2.4. Criteriul Cesaro-Stolz 2.5. Ordin de convergenţă al unui şir. Şiruri remarcabile 3. Teorema lui O. Toeplitz (O. Pop) 4. Şiruri recurente (I. Magdaş) 4.1. Noţiuni fundamentale 4.2. Recurenţe liniare de ordinul unu 4.3. Recurenţe liniare omogene de ordin superior cu coeficienţi constanţi 4.4. Recurenţe liniare neomogene de ordinul K ≥ 2 4.5. Recurenţe neliniare 5. Câteva clase de şiruri (V. Pop) 5.1. Şiruri definite implicit 5.2. Şiruri cu mulţimea termenilor finită 5.3. Evaluarea unor serii prin şiruri 6. Proprietatea lui Darboux (I. Magdaş) 6.1. Funcţii cu proprietatea lui Darboux. Generalităţi 6.2. Clase de funcţii cu proprietatea lui Darboux 6.3. Păstrarea P.D. asupra funcţiilor sumă, produs, cât, compunere a două funcţii cu P.D. 7. Aplicaţii ale teoremelor fundamentale Fermat, Rolle, Lagrange, Cauchy (I. Magdaş) 7.1. Teorema lui Fermat 7.2. Teorema lui Rolle 7.3. Teorema lui Lagrange 7.4. Teorema lui Cauchy 8. Funcţii convexe (Gh. Boroica, I. Mureşan) 8.1. Noţiuni teoretice 8.2. Inegalităţi 9. Polinoamele Taylor asociate unor funcţii (I. Boroica) 9.1. Formulele lui Taylor şi polinoamele Taylor asociate funcţiilor elementare 10. Aplicaţii ale metodelor topologice în probleme de geometrie (V. Pop) 10.1. Noţiuni teoretice necesare 11. Ecuaţii transcendente (N. Muşuroia) 11.1. Utilizarea monotoniei unor funcţii 2
11.2. Rezolvarea unor ecuaţii cu ajutorul teoremei lui Rolle şi a teoremei lui Lagrange 11.3. Utilizarea convexităţii 12. Exemple şi contraexemple în analiza matematică (V. Pop, C. Heuberger) 12.1. Completări şi precizări teoretice 12.2. Contraexemple sub formă de probleme 13. Ecuaţii funcţionale în analiza matematică (V. Pop, V. Lupşor) 13.1. Ecuaţia lui Cauchy pe R 13.2. Ecuaţia lui Jensen 13.3. Ecuaţia lui D’Alembert 13.4. Ecuaţia lui Pexider
Coordonator
Vasile Pop Viorel Lupşor
3
MATEMATICĂ PROGRAMA ŞCOLARA PENTRU CLASELE DE EXCELENŢA X-XII ARGUMENT Studiul matematicii prin clasele de excelenţă, urmăreşte în principal crearea unui cadru organizat, în care elevii talentaţi la matematică, proveniţi din diferite medii şcolare, să poată intra în contact, şi în timp relativ scurt, să formeze un grup performant. Aceşti elevi, beneficiind de o pregătire pe măsura potenţialului lor intelectual, vor contribui ulterior la formarea unei elite româneşti în domeniul matematicii. Realizarea unei programe pentru clasele de excelenţă, precum şi modul în care se va lucra pe această programă, constituie o noutate pentru învăţământul românesc. Din acest motiv elaborarea prezentei programe trebuie înţeleasă ca o etapă necesară unui început de drum. Un colectiv de cadre didactice din învăţământul preuniversitar şi universitar din CRTCP Cluj, cu experienţă în domeniul pregătirii elevilor capabili de performanţe superioare, au format o echipă care a realizat programa şi manualul care conţine exerciţii şi probleme extrem de utile pentru desăvârşirea pregătirii acestor elevi. În selectarea conţinuturilor programei s-a ţinut cont de tendinţele actuale în formularea subiectelor la concursurile şi olimpiadele şcolare, dar şi de tradiţiile şcolii româneşti de matematică. Numeroasele cărţi şi reviste adresate ˝vârfurilor ˝ au costituit o importantă sursă bibliografică în tratarea temelor. Temele propuse constituie o extindere firească a programei analitice obligatorii de matematică şi parcurgerea lor este necesară pentru abordarea unor probleme mai dificile. Anumite teme vor fi tratate pe percursul mai multor ani de studiu ( evident cu o problematică corespunzătoare) asigurându-se astfel continuitatea şi coerenţa procesului de învăţare. Mai trebuie precizat că la elaborarea programei echipa a avut în vedere faptul că matematica nu este un produs finit, ci un proces intelectual în care, pe suportul unor cunoştinţe solide, primează iniţiativa personală. Astfel, această programă oferă posibilităţi autentice de opţiune pentru profesori şi elevi. Programa se adresează elevilor claselor X-XII şi a fost concepută pentru un număr de 2 ore/săptămână ( în cele 30 de săptămâni ale anului şcolar în care se lucrează cu clasele sau grupele de excelenţă). Ca o completare la programa obligatorie de matematică, competenţelor generale le-au mai fost adăugate încă două care au rolul de a orienta demersul didactic către formarea unor ansambluri structurate de cunoştinţe generate de specificul activităţii intelectuale matematice la nivel de performanţe superioare. Programa are următoarele componente: - competenţe generale - competenţe specifice şi conţinuturile corelate cu acestea - valori şi atitudini - sugestii metodologice.
5
Competenţe generale 1. Folosirea corectă a terminologiei specifice matematicii în contexte variate 2. Prelucrarea datelor de tip cantitativ, calitativ, structural, contextual cuprinse în enunţuri matematice 3. Utilizarea corectă a algoritmilor matematici în rezolvarea de probleme cu grade diferite de dificultate 4. Exprimarea şi redactarea corectă şi coerentă în limbaj formal sau în limbaj cotidian, a rezolvării sau a strategiilor de rezolvare a unei probleme 5. Analiza unei situaţii problematice şi determinarea ipotezelor necesare pentru obţinerea concluziei 6. Generalizarea unor proprietăţi prin modificarea contextului iniţial de definire a problemei sau prin îmbunătăţirea sau generalizarea algoritmilor 7. Emiterea unor judecăţi de valoare pentru rezolvarea problemelor inventiv şi euristic- creative 8. Dobândirea unei imagini de ansamblu a matematicii elementare ca parte a unui sistem aflat în permanentă evoluţie şi interacţiune cu lumea înconjurătoare
6
Competenţe specifice Conţinuturi 1.1. Observarea proprietăţilor matricelor Elemente de algebră liniară de ordinul doi Matrice 1.2. Identificarea asemănărilor dintre • Matrice de ordinul doi operaţiile cu matrice şi cele cu aplicaţii • Determinarea puterilor naturale liniare ale unei matrice de ordinul doi 2. Interpretarea unor transformări liniare • Ecuaţii matriceale binome în (proiecţii, simetrii, rotaţii, izometrii) în M 2 (C) limbajul algebrei prin introducerea • Ecuaţii diofantice de tip Pell matricelor asociate acestora • Valori proprii şi vectori proprii 3.1. Utilizarea transformărilor elementare pentru matrice pătratice la calculul rangului şi inversei unei • Polinom caracteristic al unei matrice matrice pătratice 3.2. Identificarea procedeelor de ridicare • Teorema lui Cayley-Hamilton la putere a unei matrice • Teorema lui Frobenius 4. Utilizarea vectorilor şi valorilor proprii • Transformări elementare în ale unei matrice la găsirea unor sisteme matrice. Aplicaţii la calculul de coordonate în care transformările iau rangului şi inversei unei matrice forme mai simple • Matrice de ordinul II sau III ca 5.1. Determinarea unor matrice care transformări geometrice în plan şi satisfac anumite condiţii spaţiu 5.2. Reprezentarea permutărilor în limbajul algebrei liniare şi studierea lor Determinanţi 6. Reducerea calculului determinanţilor de ordinul n la relaţii de recurenţă • Permutări 7. Realizarea unor implicaţii între • Determinanţi de ordinul n. Deterproblemele tipice ale algebrei liniare şi minanţi speciali cele propuse la concursurile şi olim• Funcţii polinomiale de tip deterpiadele şcolare minant 8. Conştientizarea importanţei algebrei liniare la rezolvarea problemelor din alte domenii ale matematicii
7
Elemente de analiză matematică 1.Observarea comportării şirurilor recurente utilizând reprezentarea grafică 2. Identificarea proprietăţilor caracteristice ale unui şir 3.Exprimarea termenului general al unui şir recurent liniar printr-o formulă 4.Identificarea unor situaţii care pot fi exprimate matematic prin şiruri recurente 5.1.Identificarea celei mai eficiente metode de calcul a limitei unui şir 5.2. Determinarea şirurilor date prin sisteme recursive şi recurenţe omografice utilizând matricele 6.Reducerea şirurilor recurente neliniare la recurenţe mai simple sau liniare în scopul studiului convergenţei 7.Realizarea unor implicaţii între problemele tipice cu şiruri şi cele propuse la concursurile şi olimpiadele şcolare 8. Conştientizarea problematicii vaste puse de şiruri şi identificarea posibilităţilor de extindere a cercetării acestora
Mulţimi dense Şiruri de numere reale • Subşir al unui şir • Şir fundamental. Criteriul lui Cauchy • Criterii de convergenţă • Criteriul lui Cesaro-Stolz • Teorema lui Toeplitz • Ordin de convergenţă al unui şir • Şiruri remarcabile (şirurile lui Euler, Lalescu, Wallis, Stirling etc.) • Limite de şiruri definite implicit • Şiruri având mulţimea termenilor finită • Şiruri de sume • Şiruri recurente (recurenţe liniare, recurenţe omografice, recurenţe definite de funcţii monotone, sisteme recursive etc.) Funcţii continue şi derivabile • Proprietatea lui Darboux • Aplicaţii ale teoremelor fundamentale: Fermat, Rolle, Lagrange, Cauchy • Funcţii convexe • Polinoamele Taylor asociate unor funcţii
1. Observarea şi descrierea proprietăţilor unei funcţii cu proprietatea Darboux 2. Interpretarea unor proprietăţi şi teoreme referitoare la funcţii continue şi derivabile cu ajutorul reprezentărilor grafice 3. Utilizarea funcţiilor continue şi derivabile în calculul limitelor unor şiruri 4. Transpunerea în limbajul analizei matematice a proprietăţilor unor funcţii (proprietatea Darboux, convexitate etc.) 5.1. Identificarea celei mai potrivite metode de rezolvare a unei inecuaţii şi de stabilire a unor inegalităţi 5.2. Aproximarea unor funcţii cu ajutorul dezvoltării în serie Taylor 6. Realizarea de transferuri între analiza matematică pe de o parte şi geometrie şi algebră pe de altă parte prin rezolvarea de probleme de existenţă, ecuaţii transcendente şi funcţionale
Aplicaţii ale analizei matematice • Probleme de existenţă în geometrie • Ecuaţii transcendente • Ecuaţii funcţionale Contraexemple în analiza matematică
8
7. Realizarea unor implicaţii între problemele tipice ale calculului diferenţial şi cele propuse la concursurile şi olimpiadele şcolare 8.1. Conştientizarea importanţei analizei matematice în rezolvarea problemelor altor domenii ale matematicii şi a unor probleme cu conţinut practic 8.2. Realizarea de conexiuni între diferite concepte ale analizei matematice prin exemple şi contraexemple 8.3. Analiza contraexemplelor analizei matematice ca prim pas în formularea de noi rezultate şi teoreme
VALORI ŞI ATITUDINI Noul curriculum şcolar pentru clasele de excelenţă propus la matematică are în vedere formarea la elevi a următoarelor valori şi atitudini în plus faţă de cele specificate prin curriculumul şcolar obligatoriu : • Manifestarea unor opinii competente cu privire la abordarea problemelor intuitiv şi euristic-creative bazate pe explorare, inspiraţie şi invenţie • Dezvoltarea unei gândiri reflexive, independente, flexibilă şi abstractă specifică matematicii • Interesul pentru modul de dezvoltare a ideilor şi rezultatelor matematice • Curiozitatea faţă de noile deschideri din domeniul matematicii SUGESTII METODOLOGICE Prin prezentul curriculum pentru clasele de excelenţă se intenţionează ca, pe parcursul liceului, elevii să dobândească competenţe şi să-şi structureze un set de valori şi atitudini specifice pregătirii de înaltă performanţă. Acestea se regăsesc în următoarele aspecte ale învăţării, vizate de practica pedagogică : • Analizarea şi elaborarea unui plan de rezolvare pentru problemele atipice şi/sau dificile din domeniile studiate • Formarea obişnuinţei de a formula probleme şi situaţii problemă • Analiza unei probleme din punct de vedere al ideii centrale • Reparcurgerea căii de rezolvare a problemei pentru a obţine un rezultat mai bun, ameliorat sau optimizat printr-o reproiectare creativă • Identificarea unor metode de lucru valabile pentru clase de probleme
9
• •
Iniţeirea şi realizarea creativă a unei investigaţii pornind de la tematica propusă Formarea deprinderii de a anticipa rezultate matematice pornind de la datele existente • Formarea obişnuinţei de a face conexiuni intra şi interdisciplinare Acest curriculum are drept obiectiv ca fiecare elev capabil de performanţe superioare să-şi poată dezvolta competenţele într-un ritm individual, de a-şi transfera cunoştinţele acumulate dintr-o zonă de studiu în alta. Pentru aceasta se recomandă următoarele activităţi : • Alternarea prezentării conţinuturilor, cu moduri variate de antrenare a gândirii • Solicitarea de frecvente corelaţii intra şi interdisciplinare • Punerea elevului în situaţia ca el însuşi să formuleze sarcini de lucru adecvate • Obţinerea de soluţii sau interpretări variate pentru aceeaşi unitate informaţională • Prevederea de sarcini rezolvabile prin activitatea în grup • Utilizarea unor softuri educaţionale Având în vedere specificul claselor de excelenţă, metodele folosite in practice instructiv-educativă vizează următoarele aspecte: • Utilizarea strategiilor euristice, care lasăelevul să-şi asume riscul incertitudinii, al încercării şi erorii, specifice investigaţiei ştiinţifice • Utilizarea strategiilor creative, care lasă elevul să se afirme în planul originalităţii, spontaneităţii, diversităţii şi care pun accentul pe capacitatea de reflecţie, sinteză, evaluare critică şi creaţie • O îmbinare şi o alternanţă sistematică a activităţii bazate pe efort individual cu cele care solicită efort colectiv • Însuşirea unor metode de informare şi de documentare independentă, care oferă deschiderea spre autoinstruire şi spre învăţarea continuă
10
ALGEBRĂ LINIARĂ 1. Matrice de ordinul doi şi aplicaţii 1.1. Matrice de ordinul doi Definiţie 1.1.1. Prin matrice de ordinul doi înţelegem un tablou cu două linii şi două coloane, de forma: a12 a unde A = 11 a 21 a 22 numerele aij (i,j ∈ {1,2}) se numesc elementele matricei A. Sistemul ordonat de elemente (a11, a22) se numeşte diagonala principală a matricei A, iar sistemul ordonat de elemente (a12, a21) se numeşte diagonala secundară. Observaţie 1.1.2. Pentru matricea A se mai foloseşte notaţia: A = (aij) i , j∈{1, 2} . Mulţimea matricelor de ordinul doi ale căror elemente sunt numere complexe o notăm cu M2(C). În această mulţime, distingem următoarele submulţimi: M2(Z) ⊂ M2(Q) ⊂ M2(R) ⊂ M2(C). a12 a , Definiţie 1.1.3. Spunem că matricele A,B ∈ M 2 (C), A = 11 a 21 a 22 b B = 11 b21
b12 sunt egale şi scriem A=B, dacă aij=bij pentru fiecare i,j ∈ {1,2} . b22
a12 b12 a b , B = 11 , atunci Definiţie 1.1.4. Dacă A,B ∈ M 2 (C), A = 11 a 21 a 22 b21 b22 prin suma matricelor A şi B înţelegem matricea a12 + b12 a +b . C = A + B = 11 11 a21 + b21 a22 + b22
Proprietăţi 1.1.5. (ale adunării matricelor): a) A + B = B + A, ∀ A, B ∈ M 2 (C). b) (A + B) + C = A + (B + C), ∀ A, B, C ∈ M 2 (C). 0 0 (toate elementele sunt egeale cu 0) se numeşte c) Matricea O2 = 0 0 matricea zero şi are proprietatea A + O2 = O2 + A = A, ∀ A ∈ M 2 (C). 13
d) ∀ A ∈ M 2 (C), există - A ∈ M 2 (C) astfel încât A + (–A) = (–A) + A = O2. Dacă A = (aij) i , j∈{1, 2} , atunci – A= (–aij) i , j∈{1, 2} . a12 b12 a b , B = 11 , atunci Definiţie 1.1.6. Dacă A, B ∈ M 2 (C), A = 11 a 21 a 22 b21 b22 prin produsul A · B înţelegem matricea: a12 b11 b12 a11b11 + a12b21 a11b12 + a12b22 a ⋅ = . C = A ⋅ B = 11 a21 a22 b21 b22 a21b11 + a22b21 a21b12 + a22b22 Cu alte cuvinte, elementul din linia i şi coloana j a matricei produs se obţine făcând suma produselor elementelor din linia i ale matricei A cu elementele coloanei j ale matricei B, unde i,j ∈ {1,2} . Observaţie 1.1.7. În general A · B ≠ B ·A. Exemplu 1.1.8. : 1 − 2 − 5 6 1 ⋅ (−5) + (−2) ⋅ 7 1 ⋅ 6 + (−2) ⋅ (−8) − 19 22 − 5 6 1 − 2 ⋅ = = ≠ ⋅ = − 3 4 7 − 8 (−3) ⋅ (−5) + 4 ⋅ 7 (−3) ⋅ 6 + 4 ⋅ (−8) 43 − 50 7 − 8 − 3 4
(−5) ⋅ 1 + 6 ⋅ (−3) (−5) ⋅ (−2) + 6 ⋅ 4 − 23 34 = . = 7 ⋅ 1 + (−8) ⋅ (−3) 7 ⋅ (−2) + (−8) ⋅ 4 31 − 46
Proprietăţi 1.1.9. (ale înmulţirii matricelor): a) (A · B) · C = A · (B · C), ∀ A, B, C ∈ M 2 (C). b) A ·(B + C) = A · B +A · C şi (A + B) ·C = A · C +B · C , ∀ A, B, C ∈ M 2 (C). 1 0 (care are pe diagonala principală numai 1 iar c) Matricea I 2 = 0 1 restul elementelor sunt 0) se numeşte matricea unitate şi are proprietatea A · I2 = I2 ·A = A, ∀ A ∈ M 2 (C). Observaţie 1.1.10.: Deoarece înmulţirea matricelor verifică proprietatea a), putem defini puterile lui A ∈ M 2 (C), astfel: A0 = I 2 (dacă A ≠ O2), A1 = A, A2 = A ⋅ A, A3 = A2 ⋅ A,..., An = An−1 ⋅ A, n ∈ N*.
14
a12 a cu 1.1.11.: Prin produsul matricei A ∈ M 2 (C), A = 11 a 21 a 22 λa12 λa . numărul λ ∈ C, înţelegem matricea B = λ ⋅ A = 11 λ a λ a 22 21 Cum în mulţimea numerelor complexe întâlnim formule de calcul prescurtat, de exemplu x 2 − y 2 = ( x − y )( x + y ) , care are loc ∀x, y ∈ C, tot aşa în M2 (C) întâlnim formule cu matrice, dar cu condiţia ca matricele să comute între ele. Astfel, dacă A, B ∈ M 2 (C) şi A·B=B·A, m,n ∈ N*, atunci: a) Am ⋅ B n = B n ⋅ Am ; b) An − B n = ( A − B)( An−1 + An−2 B + ... + AB n−2 + B n−1 ) ; c) A2 n+1 + B 2 n+1 = ( A + B)( A2 n − A2 n−1 B + ... − AB 2 n−1 + B 2 n ) ; d) ( A + B) n = An + Cn1 An−1 B + ... + Cnn−1 AB n−1 + B n .
Definiţie
a12 a , Definiţie 1.1.12.: Prin transpusa matricei A ∈ M 2 (C), A = 11 a 21 a 22 înţelegem matricea a21 a t . A = 11 a12 a22 Matricea tA se obţine din matricea A, luând liniile (respectiv coloanele) lui A, drept coloane (respectiv linii) pentru tA.
Proprietăţi 1.1.13.: Dacă A, B ∈ M 2 (C) şi α ∈C, atunci:
a) t ( A + B) = tA + tB; b) t( α A) = α tA; c) t(A · B) = tB · tA. Observaţie 1.1.14.: Prin inducţie matematică se poate demonstra că: t (A1 · A2 · ... · An) = tAn · tAn-1 · ... · tA2 · tA1, ∀ Ak ∈ M 2 (C),
k = 1, n, n ∈ N*. Definiţie 1.1.15.: O matrice A ∈ M 2 (C) se numeşte simetrică dacă aij = aji, ∀
i , j∈{1, 2}
, adică A = tA. Mulţimea matricelor simetrice cu elemente din C se
notează cu S2(C).
15
Definiţei 1.1.16.: O matrice A ∈ M 2 (C) se numeşte antisimetrică dacă aij = –
aji, ∀
i , j∈{1, 2}
, adică A = –tA. Mulţimea matricelor antisimetrice cu elemente
din C se notează cu A2(C). Observaţie 1.1.17.: ∀ M ∈ M 2 (C), ∃ S ∈ S2(C), A ∈ A2(C) (unice) astfel încât M = S + A. Definiţie
1.1.18.: Dacă A ∈ M 2 (C), A =
matricei A este matricea
(aij) i , j∈{1, 2} , atunci conjugata
A = ( ai , j ) i , j∈{1, 2} , iar adjuncta matricei A
t
este matricea A* = ( A ). a12 a , atunci prin urma matriei Definiţie 1.1.19.: Dacă A ∈ M 2 (C), A = 11 a 21 a 22 A înţelegem nămărul Tr(A) = a11 + a22 (suma elementelor de pe diagonala principală).
Proprietăţi 1.1.20. Dacă A, B ∈ M 2 (C) şi α ∈C, atunci: a) Tr (A + B) = Tr (A) + Tr (B), b) Tr ( αA ) = α Tr (A), c) Tr (AB) = Tr (BA), d) Tr (A) = Tr (tA) Observaţie 1.1.21.: Tr (AB) ≠ Tr (A) · Tr (B). Definiţie det A =
1.1.22.: Dacă A ∈ M 2 (C),
a11
a12
a21
a22
a A = 11 a 21
a12 , atunci numărul a 22
= a11a22 − a12 a21 se numeşte determinantul matricei A.
Proprietăţi 1.1.23.: a) det (A · B) = det A · det B, ∀ A, B ∈ M 2 (C); b) det (A1 · A2 · ... · An) = det A1 · det A2 · ... · det An, ∀ Ak ∈ M 2 (C),
k = 1, n, n ∈ N*; c) det (An) = (det A) n, ∀ A ∈ M 2 (C) şi n ∈ N*; d) det (tA) = det A, ∀ A ∈ M 2 (C); 16
e) det ( λ A) = λ2 det A, ∀ A ∈ M 2 (C) şi λ ∈ C; Observaţie 1.1.24.: det (–A) = det A. Definiţie 1.1.25.: Dacă A ∈ M 2 (C) şi det A = 0, atunci matricea A se numeşte singulară, iar dacă det A ≠ 0 matricea A se numeşte nesingulară. Mulţimea matricelor pătratice de ordinul doi nesingulare, se notează cu GL2(C). Definiţie 1.1.26.: Spunem că matricea A ∈ M 2 (C) este inversabilă dacă există B ∈ M 2 (C) astfel încât A · B = B · A = I2 . Matricea B se numeşte inversa matricei A şi se notează cu A-1. (Dacă există B ea este unică). Teoremă 1.1.27: Matricea A ∈ M 2 (C) este inversabilă dacă şi numai dacă det A ≠ 0 (adică A ∈ GL2(C)).
a b , este inversabilă, atunci 1.1.28.: Dacă A ∈ M 2 (C), A = c d d − b 1 şi se numşte matrice reciprocă. A−1 = ⋅ A* , unde A* = det A − c a Observaţie 1.1.29.: O neconcordanţă între manualele vechi de algebră şi literatura de specialitate este modul de notare a matricei reciproce (greşit numită adjunctă). Formulă
Proprietăţi 1.1.30.: Dacă A, B ∈ M 2 (C) sunt inversabile şi λ ∈ C*, atunci: a) (AB)-1 = B-1 · A-1, 1 b) ( λ A) -1 = · A-1,
λ
c) (tA)-1 = t(A-1), d) (An)-1 = (A-1) n. Observaţie 1.1.31.: Prin inducţie matematică se poate arăta că (A1 · A2 · ... · An)-1 = An−1 ⋅ An−−11 ⋅ ... ⋅ A2−1 ⋅ A1−1 , unde Ak ∈ M 2 (C), k = 1, n, n ∈ N*, sunt matrice inversabile.
17
Definiţie 1.1.32.: Matricea A∈ GL2(C) se numeşte ortogonală dacă tA = A-1 iar matricea A∈ GL2(R) se numeşte unitară dacă A* = A-1. Definiţie 1.1.33.: Matricele A, B ∈ M 2 (C) sunt asemenea dacă există C∈ GL2(C) astfel încât B = C-1AC. Se notează A ~ B. Definiţie 1.1.34.: Matricele A, B ∈ M 2 (C) sunt echivalente dacă există C, D∈ GL2(C) astfel încât A = CBD. Se notează A ≈ B.
1.2. Teorema lui Cayley-Hamilton a b . Definiţie 1.2.1.: Fie A ∈ M 2 (C), A = c d Ecuaţia det( A − λI 2 ) = λ2 − Tr ( A)λ + det A = 0 , unde Tr(A) = a + d (urma matricei A) iar det A = ad – bc, se numeşte ecuaţia caracteristică a matricei A, iar rădăcinile ecuaţiei se numesc valori proprii. Teoremă 1.2.2. (Cayley-Hamilton) Orice matrice pătratică verifică propria sa ecuaţie caracteristică, adică 2 A − Tr ( A) ⋅ A + det A ⋅ I 2 = O2 , a b ∈ M 2 (C). unde A = c d a 2 + bc b(a + d ) , se verifică imediat că Demonstaţie: Cum A2 = 2 d (a + d ) bc + d egalitatea are loc.
a b ∈ M 2 (C) şi det A = ad – bc = 0, atunci An Consecinţa 1.2.3. Dacă A = c d n-1 = (Tr A) ·A, ∀n ∈ N, n ≥ 2 . Demonstraţie: Deoarece det A = ad – bc = 0, din teorema lui Cayley – Hamilton, rezultă că A2 − Tr ( A) ⋅ A = O2 , de unde obţinem A2 = Tr ( A) ⋅ A şi A3 = A2 ⋅ A = (TrA) ⋅ A ⋅ A = (TrA) ⋅ (TrA) ⋅ A = (TrA) 2 ⋅ A . Prin inducţie matematică rezultă că An = (TrA) n−1 ⋅ A, ∀n ∈ N, n ≥ 2 .
18
Consecinţa 1.2.4. Dacă A ∈ M 2 (C) şi Tr (A) = 0, atunci (− det A) k ⋅ I 2 , n = 2k , k ∈ Ν * . An = k (− det A) ⋅ A, n = 2k + 1, k ∈ Ν Demonstraţie: Din teorema lui Cayley – Hamilton rezultă 2 A + (det A) I 2 = O2 , deci A2 = (− det A) ⋅ I 2 şi prin inducţie matematică pentru n par sau impar rezultă afirmaţia din enunţ.
Consecinţa 1.2.5. Fie A ∈ M 2 (C). Să se arate că următoarele afirmaţii sunt echivalente: a) A2 = O2 ; b) Există n ∈ N, n ≥ 2 astfel încât An = O2 . Demonstraţie: a) ⇒ b) Evident (există n = 2 astfel încât A2 = O2 ); b) ⇒ a) Dacă există n ∈ N, n ≥ 2 astfel încât An = O2 , atunci (det A)n = 0, de unde det A = 0 şi, conform consecinţei 1.3.3., rezultă O2 = An = (TrA) n−1 ⋅ A , de unde A = O2 sau Tr A = 0. Dacă A = O2 , atunci A2 = O2 . Dacă Tr A = 0, din teorema lui Cayley – Hamilton, obţinem 2 A = O2 .
1.3. Determinarea puterilor naturale ale unei matrice de ordinul doi În continuare, ne propunem să găsim un procedeu pentru ridicarea unei matrice de ordinul doi la puterea n, n ∈ N*. a b ∈ M 2 (C) şi ecuaţia caracteristică Teorema 1.3.1. Dacă A = c d a−λ b = λ2 − (a + d )λ + ad − bc = 0 , are rădăcinile reale c d −λ λ1 , λ2 , atunci există matricele B, C ∈ M 2 (C) astfel încât: (1)
λ1n ⋅ B + λn2 ⋅ C , λ1 ≠ λ 2 . A = n n −1 λ1 ⋅ B + n ⋅ λ1 ⋅ C , λ1 = λ 2 n
19
Demonstraţie: Evident, matricea A verifică relaţia A − TrA ⋅ A + det A ⋅ I 2 = O2 , unde Tr(A) = a + d şi detA = ad – bc. Înmulţind relaţia de mai sus cu An-1, obţinem An+1 − TrA ⋅ An + det A ⋅ An−1 = O2 , de unde (*) An+1 = TrA ⋅ An − det A ⋅ An−1 . a bn şi ţinând cont de relaţia (*), obţinem: Considerând An = n c d n n 2
xn+1
an+1 = Tr ( A)an − det A ⋅ an−1 bn+1 = Tr ( A)bn − det A ⋅ bn−1 cn+1 = Tr ( A)cn − det A ⋅ cn−1 d n+1 = Tr ( A)d n − det A ⋅ d n−1 , n ≥ 2 . Deci, toate şirurile verifică aceeaşi relaţie de recurenţă: = Tr ( A) ⋅ xn − det A ⋅ xn−1 , n ≥ 2 .
Ecuaţia caracteristică fiind λ2 − Tr ( A)λ + det A = 0 , cu rădăcinile presupuse reale, rezultă: - dacă λ1 ≠ λ2 , obţinem xn = α x λ1n + β x λn2 , unde α x , β x ∈ C. Deci
an = α a λ1n + β a λn2 bn = α b λ1n + β b λn2 cn = α c λ1n + β c λn2 d n = α d λ1n + β d λn2 , adică
βb α α b β , C = a astfel încât există matricele B, C ∈ M 2 (C), B = a α c α d βc βd An = λ1n B + λn2C . - dacă λ1 = λ2 , obţinem xn = α x λ1n + β x nλ1n−1 , unde α x , β x ∈ C. Deci
an = α a λ1n + β a nλ1n−1 bn = α b λ1n + β b nλ1n−1 cn = α c λ1n + β c nλ1n−1 d n = α d λ1n + β d nλ1n−1 , adică
α α b β , C = n a există matricele B, C ∈ M 2 (C), B = a α c α d βc n n n −1 A = λ1 B + λ1 ⋅ n ⋅ C .
20
βb astfel încât β d
a b pentru care În concluzie, orice matrice de ordinul doi de forma c d ecuaţia λ2 − (a + d )λ + ad − bc = 0 are rădăcinile reale λ1 , λ2 , se poate pune sub forma din teoremă, unde matricele B şi C se determină, practic, din relaţia (1), făcându-l pe n egal cu 1 şi apoi egal cu 2. a b ∈ M 2 (C), atunci pentru orice număr natural Teoremă 1.3.2. Dacă A = c d n ∈ N*, există două şiruri de numere complexe ( xn ) n≥1 şi ( yn ) n≥1 astfel încât An = xn ⋅ A + yn ⋅ I 2,∀n ≥ 1 .
Demonstraţie: Folosim metoda inducţiei matematice. Pentru n = 1, proprietatea este adevărată, deoarece există x1 = 1, y1 = 0 astfel încât A = 1 · A + 0 · I2. Pentru n = 2, există x2 = a + d = Tr ( A) şi y2 = −(ad − bc) = − det A , astfel încât A2 = (a + d ) A − (ad − bc) I 2 . Presupunem proprietatea adevărată pentru un număr natural n ≥ 1 , adică ∃ xn , yn ∈ C astfel încât An = xn ⋅ A + yn ⋅ I 2 . Atunci, obţinem:
An+1 = An ⋅ A = ( xn ⋅ A + yn ⋅ I 2 ) ⋅ A = xn ⋅ A2 + yn ⋅ A = xn ( x2 ⋅ A + y2 ⋅ I 2 ) + yn A =
xn+1
= ( x2 ⋅ xn + yn ) ⋅ A + xn ⋅ y2 ⋅ I 2 = xn+1 ⋅ A + yn+1 ⋅ I 2 , unde (1) = x2 xn + yn = (TrA) xn + yn şi (2) yn+1 = y2 xn = − det A ⋅ xn . Deci,
An = xn ⋅ A + yn ⋅ I 2,∀n ≥ 1 .
Din relaţiile (1) şi (2) rezultă xn şi yn. Astfel, din (2) rezultă yn = − det A ⋅ xn−1 , care înlocuit în (1), obţinem xn+1 − TrA ⋅ xn + det A ⋅ xn−1 = 0 , care are ecuaţia caracteristică λ2 − TrAλ + det A = 0 . Dacă ecuaţia de mai sus are rădăcini reale, atunci xn = αλ1n + βλn2 , dacă λ1 ≠ λ2 şi xn = αλ1n + βnλ1n−1 dacă λ1 = λ2 , după care rezultă expresia lui yn.
21
1.4. Determinarea şirurilor date prin sisteme recursive, recurente omografice şi ecuaţii diofantice de tip Pell 1.4.1. Determinarea şirurilor date prin sisteme recursive
Fie şirurile de numere reale ( xn ) n≥0 , ( yn ) n≥0 definite prin sistemul de relaţii de recurenţă: xn+1 = axn + byn , unde n ∈ N iar a, b, c, d, x0, y0 sunt numere (1) yn+1 = cxn + dyn reale date. Sistemul (1) poate fi scris sub formă matriceală astfel: x xn+1 a b xn x = ⋅ sau (2) n+1 = A n , ∀n ≥ 0 , unde yn yn+1 c d yn yn+1 a b . A = c d Dând , în relaţia (2), lui n valorile 0,1,2,...,n-1 obţinem: x x x xn+1 x = A n = A2 n−1 = ... = An 1 = An+1 0 . y1 y0 yn−1 yn yn+1 x x Deci n = An 0 , ∀n ≥ 0 şi problema revine acum la aflarea formei y0 yn generale a lui An.
Observaţii 1.4.2.: 1. Dacă ∆ = (TrA) 2 − 4 det A ≤ 0 , atunci metoda expusă aici devine eficientă pentru aflarea şirurilor ( xn ) n≥0 şi ( yn ) n≥0 ; 2. Pentru a calcula An se poate folosi ecuaţia caracteristică: A2 − TrA ⋅ A + det A ⋅ I 2 = O2 , A ∈ M 2 (R). 1.4.3. Determinarea şirurilor date prin recurenţe omografice
d Definiţie 1.4.4.: Funcţia f: R - − → R, f ( x) = c a 0, se numeşte funcţie omografică, iar M f = c ataşată funcţiei f.
22
ax + b , a, b, c, d ∈ R, c ≠ cx + d b se numeşte matricea d
Proprietate 1.4.5.: Dacă f şi g sunt funcţii omografice, atunci pe mulţimea D ⊂ R pe care sunt definite funcţiile f o g şi f n = f o f o ... o f , n ∈ N*, funcţiile 142 4 43 4 n ori
n
f o g şi f sunt omografice şi avem relaţiile: M f og = M f ⋅ M g ,
M f n = ( M f ) n , n ∈ N*. Demonstraţie:
d d ' g: R − → R, − → R, c c' a b ax + b a ' x + b' , M f = , g ( x) = funcţii omografice şi f ( x) = cx + d c' x + d ' c d a ' b' matricele ataşate celor două funcţii. M g = c' d ' Atunci, pe mulţimea D ⊂ R, pe care există compunerea f o g , avem: a ' x + b' +b a⋅ (aa'+bc' ) x + ab'+bd ' ag ( x) + b c' x + d ' ( f o g )( x) = f ( g ( x)) = , = = ' ' + a x b ( ca ' dc ' ) x cb ' dd ' cg ( x) + d c ⋅ + + + +d c' x + d ' tot o funcţie omografică şi aa'+bc' ab'+bd ' a b a' b' = ⋅ = M f ⋅ M g . M f o g = ca'+ dc' cb'+ dd ' c d c' d ' Egalitatea a doua se demonstrează prin inducţie matematică. Fie
f:
R
-
Definiţie 1.4.6.: Un şir recurent definit printr-o recurenţă de forma xn+1 = f ( xn ) , unde f este o funcţie omografică, se numeşte recurenţă omografică. Observaţia 1.4.7.: Ca recurenţa să definească un şir e necesar ca cxn + d ≠ 0, ∀n ∈ N. Proprietate 1.4.8.: Dacă xn+1 = f ( xn ), ∀n ≥ 0 , atunci
xn = f n ( x0 ) , unde f n ( x0 ) = ( f o f o ... o f )( x0 ) 142 4 43 4 n ori
23
Demonstraţie: Pentru demonstraţie se foloseşte metoda inducţiei matematice. ax + b d Într-adevăr, fie f: R - − → R, f ( x) = . Dacă xn+1 = f ( xn ) , cx + d c ax + b ax + b , ∀n ≥ 0 şi atunci x1 = f ( x0 ) = 0 , adică lui x1 i se rezultă xn+1 = n cxn + d cx0 + d a b , iar ataşează matricea A = c d ax + b a⋅ 0 +b (a 2 + bc) x0 + b(a + d ) cx0 + d ax1 + b = şi x2 = f ( x1 ) = = cx1 + d c ⋅ ax0 + b + d c(a + d ) x0 + bc + d 2 cx0 + d a 2 + bc b(a + d ) , adică lui x2 i se ataşează matricea A2. A2 = 2 c(a + d ) bc + d a x + bn i se asociază Presupunând că lui xn = n 0 c n x0 + d n n
a b an = A = c d cn n
matricea
bn , avem d n
an x0 + bn +b (aan + bcn ) x0 + (abn + bd n ) axn + b c n x0 + d n = f ( xn ) = = şi = cxn + d c ⋅ an x0 + bn + d (can + dcn ) x0 + (cbn + dd n ) c n x0 + d n a⋅
xn+1
a b an bn aan + bcn abn + bd n = , ⋅ An+1 = An ⋅ A = A ⋅ An = c d cn d n can + dcn cbn + dd n obţinem că lui xn+1 i se asociază matricea An+1. a x + bn Rezultă că xn = n 0 şi căruia i se asociază matricea c n x0 + d n n
a bn a b = . A = n cn d n c d Deci, pentru a calcula pe xn în funcţie de x0, este suficient să calculăm pe An. n
24
Observaţie 1.4.9.: Şirul ( xn ) n≥0 poate fi definit cu anumite condiţii asupra teremnului iniţial x0. Din expresiile matricei An deducem condiţiile de existenţă a şirului recurent cn x0 + d n ≠ 0, ∀n ∈ N sau d x0 ≠ − n , n ∈ N. cn d Se determină mulţimea S = − n n ∈ N şi atunci condiţia este x0 ∈ R \ S. cn
1.4.10. Ecuaţii diofantice de tip Pell
Fie d ∈ N, d ≥ 2 un număr liber de pătrate ( d ∉ Q). Definiţie 1.4.11.: Ecuaţia diofantică P : x 2 − dy 2 = 1 , unde x, y ∈ Z se numeşte ecuaţia lui Pell.
În cele ce urmează vom rezolva în numere întregi ecuaţia lui Pell. Observaţie 1.4.12.: 1). Perechile (–1, 0), (1, 0) sunt soluţii ale ecuaţie P şi se numesc soluţii banale. 2). Dacă (x, y) este soluţie a ecuaţiei P, atunci şi (-x, y), (x, –y), (–x, –y) sunt soluţii ale ecuaţiei. Deci, pentru a rezolva ecuaţia lui Pell, este sufficient să-i aflăm soluţiile în mulţimea numerelor naturale (( x, y ) ∈ N x N, (x, y) ≠ (1,0) ) . x dy Fie perechea ( x, y ) ∈ N x N căreia îi ataşăm matricea Ax , y = y x pentru care det Ax , y = x 2 − dy 2 = 1 . Dacă notăm cu SP mulţimea soluţiilor ecuaţiei lui Pell, atunci ( x, y ) ∈ S P dacă şi numai dacă det Ax , y = 1 , iar (x, y) ≠ (1,0) dacă şi numai dacă Ax , y ≠ I 2 . Dacă ( x0 , y0 ) ∈ S P , ( x0 , y0 ) ≠ (1,0) , atunci det Ax0 , y0 = 1 , de unde rezultă det Axn0 , y0 = 1 . x Fie Axn0 , y0 = n yn atunci
dyn x cu xn2 − dyn2 = 1 şi dacă Axn0+,1y0 = n+1 xn yn+1
25
dyn+1 , xn+1
x Axn0+,1y0 = Axn0 , y0 ⋅ Ax0 , y0 = n yn
dy0 x0 xn + dy0 yn = x0 y0 xn + x0 yn
dyn x0 ⋅ xn y0
d ( y 0 x n + x0 y n ) x0 xn + dy0 yn
iar det Axn0+,1y0 = det( Axn0 , y0 ⋅ Ax0 , y0 ) = det Axn0 , y0 ⋅ det Ax0 , y0 = 1 .
Rezultă xn+1 = x0 xn + dy0 yn yn+1 = y0 xn + x0 yn sau (1) xn = x0 xn−1 + dy0 yn−1 (1’) yn = y0 xn−1 + x0 yn−1 , n ≥ 1 , cu x0, y0 daţi astfel încât (x0, y0) ≠ (1,0). Dacă ( x0 , y0 ) ∈ N x N, atunci şi ( xn , yn ) ∈ N x N, cu alte cuvinte, dacă (x0, y0) este soluţie a ecuaţiei Pell, atunci şi (xn, yn) este soluţie a ecuaţiei Pell. Relaţiile de recurenţă (1) şi (1’) pot fi scrise marticeal xn x0 dy0 xn−1 = ⋅ sau yn y0 x0 yn−1 xn x0 = yn y0
dy0 x0
n
x ⋅ 0 , y0
iar
de
aici,
folosind
ecuaţia
n
x dy0 , rezultă: caracteristică pentru aflarea lui 0 y0 x0 n +1 n +1 1 + x0 − y 0 d xn = x0 + y0 d 2 (*) n +1 n +1 1 − x0 − y0 d , n ≥ 0, yn = x0 + y 0 d 2 d şi luând soluţia (x0, y0) minimă nebanală (cu x0 minim dacă şi numai dacă y0 minim) obţinem că S P ⊂ {(−1,0), (1,0), ( xn , yn ), (− xn , yn ), ( xn ,− yn ), (− xn ,− yn )} = S . Vom arăta reciproca, S ⊂ S P . Dacă ( x, y ) ∈S ∩ N x N, (x, y) ≠ (1,0), definim B = Ax , y şi B1 = A−1 ⋅ B
(
)
(
(
)
)
(
)
x dy0 , unde (x0, y0) este soluţia minimă. Rezultă det B1 = 1 şi cu Ax0 , y0 = 0 y x 0 0 x' = x0 x − dy0 y x' dy ' , unde , din care se deduce că x' < x, y ' < y dacă B1 = y ' x' y ' = − y 0 x + x0 y (x, y) ≠ (1,0) şi ( x' , y ' ) ∈ N x N. Continuând găsim B2 = A−1 ⋅ B1 , B3 = A−1 ⋅ B2 ,
..., Bk = A−1 ⋅ Bk −1 = I 2 şi mergând înapoi rezultă Ax , y = Axk0−,1y0 , adică ( x, y ) ∈ S P . 26
Exerciţiu 1.4.13.: Să se afle soluţia generală în Z x Z a ecuaţiei diofantice x2 − 2 y2 = 1. Fie (x0, y0) = (3,2) soluţia pozitivă minimă a ecuaţiei, diferită de soluţiile banale (1,0) şi (–1,0). Ecuaţia dată are deci o infinitate de soluţii date de (*) în care vom înlocui x0 = 3, y0 = 2 şi d = 2. Obţinem: n +1 n +1 1 + 3− 2 2 xn = 3 + 2 2 2 n +1 n +1 1 yn = 3+ 2 2 − 3 − 2 2 , n ≥ 0, iar 2 2
(
)
(
(
)
)
(
)
S P = {(± xn ,± yn ) n ∈ N }∪ {(±1,0)} .
Observaţie 1.4.14.: Soluţiile ecuaţiei Pell, pot fi utilizate în aproximarea radicalilor numerelor naturale care nu sunt pătrate perfecte. Într-adevăr, dacă ( xn , yn ) n≥1 sunt soluţii ale ecuaţiei x 2 − dy 2 = 1 , atunci 1 deci xn − y n d = xn + y n d xn 1 1 1 − d = < < 2 , de unde rezultă 2 yn y n ( xn + y n d ) d yn yn
xn x = d , adică fracţiile n aproximează pe yn yn 1 decât 2 . yn lim n →∞
d cu o eroare mai mică
1.4.15. Ecuaţia ax 2 − by 2 = 1 , ( a, b ∈ N*). Observaţie: Această x 2 − dy 2 = 1 .
ecuaţie este mai generală decât ecuaţia lui Pell,
Proprietate 1.4.16.: Dacă ab = k 2 , k ∈ N, k > 1, atunci ecuaţia ax 2 − by 2 = 1 nu are soluţii în numere naturale.
27
Demonstraţie: Într-adevăr, presupunem că ecuaţia dată ar avea o soluţie în numere naturale (x0, y0), atunci ax02 − by02 = 1 , adică a şi b sunt prime între ele. Urmează
că egalitatea ab = k 2 implică a = k12 , b = k 22 , unde k1k 2 = k , k1 , k 2 ∈ N*. Ecuaţia devine k12 x 2 − k 22 y 2 = 1 sau (k1 x − k 2 y )(k1 x + k 2 y ) = 1 , adică 1 < k1 x + k 2 y = k1 x − k 2 y = 1 , ceea ce este imposibil. Vom numi rezolventa Pell a ecuaţiei ax 2 − by 2 = 1 , ecuaţiea u 2 − abv 2 = 1 şi vom demonstra următoarea: Proprietate 1.4.17.: Dacă ecuaţia ax 2 − by 2 = 1 , are o soluţie nebanală în numere naturale, atunci ea are o infinitate de soluţii în numere naturale. Demonstraţie: Fie (x0, y0), x0 , y 0 ∈ N* o soluţie a ecuaţiei ax 2 − by 2 = 1 . Deoarece ab nu este pătrat perfect, conform teoremei demonstrate mai sus, rezultă că rezolventa Pell are o infinitate de soluţii în numere naturale, date de formulele (*). Notăm cu (un, vn), n ∈ N, soluţia generală a rezolventei Pell u 2 − abv 2 = 1 . Atunci ( xn , yn ), n ∈ N, unde xn = x0u n + by0 vn , yn = y0u n + ax0 vn sunt soluţii ale
ecuaţiei ax 2 − by 2 = 1, ∀n ∈ N, deoarece axn2 − byn2 = a( x0un + by0 vn ) 2 − b( y0u n + ax0 vn ) 2 = (ax02 − by02 )(u n2 − abvn2 ) = 1, ∀n ∈ N, adică ecuaţia ax 2 − by 2 = 1 are o infinitate de soluţii. Proprietate 1.4.18. Soluţia generală a ecuaţiei ax 2 − by 2 = 1 este ( xn , yn ), n ∈ N, unde xn = Aun + bBvn , yn = Bu n + aAvn ,(un, vn), n ∈ N, fiind soluţia generală a rezolventei Pell, iar (A,B), A,B ∈ N, cea mai mică soluţie a ecuaţiei considerate. Demonstraţie: Am arătat mai sus, că dacă (un, vn), n ∈ N, este soluţia generală a rezolventei Pell, atunci ( xn , yn ), n ∈ N, sunt soluţii ale ecuaţiei ax 2 − by 2 = 1 . Reciproc, arătăm că dacă ( xn , yn ), n ∈ N, sunt soluţii ale ecuaţiei
ax 2 − by 2 = 1 , atunci (un, vn), n ∈ N, unde u n = aAxn − bByn , vn = Bxn − Ayn , sunt soluţii ale rezolventei Pell, u 2 − abv 2 = 1 . Într-adevăr 2 u n − abvn2 = (aAxn − bByn ) 2 − ab( Bxn − Ayn ) 2 = (aA2 − bB 2 )(axn2 − byn2 ) = 1, ∀n ∈ N, propoziţia fiind astfel demonstrată. 28
În cazul particular b = 1, metoda expusă mai sus oferă rezolvarea ecuaţiei dx − y 2 = 1 , pe care o vom numi ecuaţia Pell conjugată. Prin urmare, soluţia generală a ecuaţiei Pell conjugate este ( xn , yn ), n ∈ N, unde: xn = Aun + Bvn , yn = Bun + DAvn , 2
(A,B) fiind cea mai mică soluţie a ecuaţiei Dx 2 − y 2 = 1 , iar (un, vn), n ∈ N soluţiile ecuaţiei lui Pell u 2 − dv 2 = 1 . Observaţie 1.4.19.: Şirurile ( xn ) n≥0 , ( yn ) n≥0 definite recursiv prin relaţiile de
[
]
mai sus, verifică identitatea y n = d x n , ∀n ∈ N. Într-adevăr, ( xn , yn ), n ∈ N fiind soluţia generală a ecuaţiei Pell conjugate, dx 2 − y 2 = 1 , avem
(
d xn + y n
)(
)
d xn − y n = 1 .
Dar xn , yn ∈ N*, ∀n ∈ N şi deci 0 < d xn − yn < 1 , de unde yn < d xn < yn + 1 , adică y n =
[
d xn + yn > 1 . Prin urmare
]
d x n , ∀n ∈ N.
Exerciţiu 1.4.20.: Să se afle soluţia generală în N x N a ecuaţiei 6x2 − 5 y2 = 1 . Cea mai mică soluţie a ecuaţiei este (1,1). Rezolventa Pell este ecuaţia 2 u − 30v 2 = 1 , care are cea mai mică soluţie (11,2). Ţinând seama de (*), găsim soluţia generală a rezolventei Pell (un, vn), n ∈ N, u n+1 = 11u n + 60vn , vn+1 = 11vn + 2un , u1 = 11, v1 = 2 . Folosind ultima proprietate demonstrată, obţinem soluţia generală a ecuaţiei 6 x 2 − 5 y 2 = 1 , ( xn , yn ), n ∈ N, xn = u n + 5vn , yn = u n + 6vn , iar forma explicită este (din (*)): 6 + 30 6 − 30 (11 + 2 30 ) n + xn = (11 − 2 30 ) n , 12 12 5 + 30 5 − 30 (11 + 2 30 ) n + yn = (11 − 2 30 ) n . 12 12
29
1.5. Ecuaţii matriceale binome în M2(C) Definiţie 1.5.1.: Ecuaţia matriceală X n = A , unde A ∈ M 2 (C) este o matrice dată, n ∈ N, n ≥ 2 , un număr natural fixat, iar X ∈ M 2 (C) este o matrice necunoscută, se numeşte ecuaţie matriceală binomă. În majoritatea metodelor de rezolvare ale ecuaţiilor matriceale binome se folosesc următoarele rezultate: 1). Dacă X ∈ M 2 (C) şi det X = 0, atunci X n = (t X ) n−1 X , n ≥ 2 , iar t X este urma matricei X; 2). Dacă X n = A , atunci AX =XA; 3). Dacă A ∈ M 2 (C), A ≠ aI 2 , pentru orice a ∈ C, atunci matricele X ∈ M 2 (C) care comută cu A sunt de forma X = αA + βI 2 ; a b , atunci X 2 − (a + d ) X + (ad − bc) I 2 = 0 4). Dacă X ∈ M 2 (C), X = c d (t x = a + d , d x = ad − bc) ;
5). Dacă există n ≥ 2 astfel ca X n = O atunci X 2 = O . 6). Dacă valorile proprii ale matricei A ∈ M 2 (C) sunt distincte (λ1 ≠ λ2 ) , atunci există o matrice P nesingulară (matrice de pasaj) astfel ca λ 0 P −1 ⋅ A ⋅ P = 1 0 λ2 Primele cinci rezultate au fost justificate anterior, vom justifica afirmaţia 6). Dacă λ1 , λ2 sunt valorile proprii ale matricei A, atunci: ( A − λ1 I 2 )( A − λ2 I 2 ) = 0 , iar matricele A − λ1 I 2 şi A − λ2 I 2 au determinanţii zero, deci există X 1 , X 2 ∈ M 2 (C), X 1 ≠ 0, X 2 ≠ 0 astfel încât AX 1 = λ1 X 1 , AX 2 = λ2 X 2 . x x X 1 = 11 , X 2 = 21 , x12 x22 x21 x este inversabilă. P = ( X 1 , X 2 ) = 11 x x 22 12
Dacă
arătăm
că
matricea
Dacă prin absurd coloanele ar fi proporţionale X 1 = αX 2 , α ∈ C*, am avea:
30
AX1 = λ1 X1 ⇔ AαX 2 = λ1αX 2 ⇔ αAX2 = αλ1 X 2 ⇔ αλ2 X 2 = αλ1 X 2 ⇔ α(λ1 − λ2 ) X 2 = 0 deci λ1 = λ2 , contradicţie. λ 0 = P ⋅ J A , deci Avem AP = A( X 1 , X 2 ) = (λ1 X 1 , λ2 X 2 ) = ( X 1 , X 2 ) 1 0 λ 2 λ 0 . P −1 ⋅ A ⋅ P = J A = 1 0 λ2 În continuare vom prezenta câteva cazuri de ecuaţii matriceale binome. 1. Ecuaţia X n = A , n ≥ 2 , A ∈ M 2 (C) şi det A = 0. Rezolvare: Din X n = A rezultă (det X ) n = det A = 0 , deci det X = 0 şi din 1) rezultă
X n = (t X ) n−1 X , unde t X este urma matricei X. Se obţine (t X ) n−1 X = A , în care egalând urmele, obţinem (t X ) n−1 ⋅ t X = t A sau (t X ) n−1 = t A . 1.1. Dacă urma matricei A este t A ≠ 0 (din 4), A2 ≠ 0 ), atunci (t X ) n = t A dă urmele matricei X, adică t X ∈ {t1 , t 2 ,..., t n }, unde t1 , t 2 ,..., t n sunt rădăcinile de ordinul n ale lui t A (t1n = t 2n = ... = t nn = t A ) . În concluzie, pentru A ∈ M 2 (C), A2 ≠ 0 şi det A = 0, ecuaţia X n = A are în M 2 (C), n soluţii: 1 1 X k = n−1 = t k A, k = 1, n unde t1 , t 2 ,..., t n sunt rădăcinile tk tA ecuaţiei algebrice t xn = t A ( t A fiind urma matricei A). −1 − 2 . Exemplu 1.5.2. Să se rezolve ecuaţia: X 4 = 2 1 Soluţie: −1 − 2 , det A = 0, tr A = 1, t 4 = 1 , t ∈ {1,−1, i,−i}. Soluţiile Avem A = 2 1 sunt: X = ± A, X = ±iA .
1.2. Dacă urma matricei A este t A = 0, atunci A2 = 0 şi din X n = A , rezultă X 2 n = A2 = 0 , iar din 5) rezultă X 2 = 0 . În concluzie pentru A ≠ 0 şi A2 = 0 ecuaţia X n = A , nu are soluţii (pentru n ≥ 2 ).
31
Dacă A = 0, din X n = O rezultă ecuaţia X 2 = O ceea ce, notând a 2 + bc = 0 a b b(a + d ) = 0 , cu soluţiile X = conduce la sistemul de ecuaţii pătratice c d c ( a + d ) = 0 d 2 + bc = 0 b a 2 , a ∈ C, b ∈ C* şi X = 0 0 , c ∈ C. a X a ,b = c c 0 − − a b Exemple 1.5.3.: 0 1 nu are soluţii pentru n ≥ 2 . 1). Să se arate că ecauţia X n = 0 0 Soluţie: Ridicând la pătrat obţinem X 2 n = 0 , deci X 2 = 0 şi cum n ≥ 0 , 0 1 . X n = 0 ≠ 0 0 b a ∈ M 2 (R) unde a, b, c, d sunt 2). Să se determine matricele X = − c − d
numere prime şi X 2 = 0 . Soluţie: b 2 a şi condiţia a să fie prim, Din soluţia generală X a ,b = a 2 − − a b b p 1 1 p , p ∈ N* cu p = p rezultă a = b. Deci, soluţiile sunt X = − 1 − 1 − p − p număr prim.
2. Ecuaţia X n = aI 2 , a ∈ C*, X ∈ M 2 (C), n ≥ 2 . Rezolvare: Să observăm că dacă X este soluţie, atunci pentru orice matrice inversabilă P ∈ M 2 (C), matricea X P = P −1 ⋅ X ⋅ P este de asemenea soluţie. Într-adevăr, X Pn = P −1 ⋅ X ⋅ P ⋅ P −1 ⋅ X ⋅ P ⋅ ... ⋅ P −1 ⋅ X ⋅ P = = P −1 ⋅ X n ⋅ P = P −1 ⋅ aI 2 ⋅ P = aI 2 .
32
2.1. Dacă valorile proprii ale matricei X sunt distincte, atunci conform λ 0 şi ecuaţia devine: observaţiilor iniţiale ( 6) ) rezultă că există X P = 1 0 λ 2 λ1n 0 a 0 0 λn = 0 a cu soluţiile λ1 , λ2 ∈ {a1 , a2 ,..., an } , rădăcinile de ordinul n 2 ale lui a. În concluzie, o parte din soluţiile ecuaţiei X n = aI 2 sunt ai 0 −1 ⋅ P (*) unde ai , a j sunt rădăcinile arbitrare ale ecuaţiei X = P ⋅ a 0 j n x = a iar P ∈ M 2 (C) o matrice nesingulară arbitrară.
2.2. Dacă valorile proprii ale matricei X sunt egale λ1 = λ2 = λ , atunci din 4), rezultă ( X − λI 2 ) 2 = 0 şi notând Y = X − λI 2 , rezultă X = λI 2 + Y cu Y 2 = 0 . Avem X n = λn I 2 + nλn−1 B şi ecuaţia X n = aI 2 , devine λn I 2 + nλn−1 B = aI 2 sau nλn−1 B = (a − λn ) I 2 . a − λn I n rezultă B = 0 şi nλn−1 a = λn , deci X = ai I 2 . În concluzie, soluţiile sunt de forma (*) (fără condiţia ai ≠ a j ).
Din a ≠ 0 rezultă λ ≠ 0 şi din B 2 = 0, B =
3. Ecuaţia X n = A în care valorile proprii ale matricei A sunt λ1 , λ2 distincte. Rezolvare: Dacă valorile proprii ale lui X sunt µ1 , µ 2 , atunci µ1n = λ1 , µ 2n = λ2 deci λ1 0 , 0 λ2 atunci înmulţind în relaţia X n = A cu P–1 la stânga şi P la dreapta, rezultă n µ1 0 λ1 0 λ1 0 λ1 0 −1 n n = , deci sau X P = sau ( P ⋅ X ⋅ P) = 0 µ 2 0 λ2 0 λ2 0 λ2
µ1 ≠ µ 2 . Dacă P este matricea nesingulară pentru care P −1 ⋅ A ⋅ P =
33
α 0
µ1n = λ1 , µ 2n = λ2 . Soluţiile sunt de forma X = P ⋅
0 −1 ⋅ P , unde α n = λ1 , β
β n = λ2 şi P ∈ M 2 (C) este matrice nesingulară. Observaţie 1.5.4.: O altă metodă de rezolvare se bazează pe observaţiile 2) şi 3).
4. Dacă A ≠ aI 2 , a ∈ C, atunci din XA = AX, rezultă că matricele X care verifică ecuaţia X n = A sunt de forma X = αA + βI 2 . Valorile proprii ale matricei X sunt µ1 = αλ1 + β , µ 2 = αλ 2 + β , unde λ1 , λ2 sunt valorile proprii ale matricei A. Valorile proprii ale matricei X n sunt µ1n şi µ 2n şi se obţin (αλ1 + β ) n = λ1 , (αλ2 + β ) n = λ2 . Ultimele două relaţii le privim ca sistem în necunoscutele α , β . αλ1 + β = λ1 ⋅ ε k , unde ε k , ε p sunt rădăcini de ordin n ale unităţii. Avem αλ2 + β = λ2 ⋅ ε p Se obţine:
λ1ε k − λ 2 ε p λ1 − λ 2 , dacă λ1 ≠ λ2 . λ1λ 2 (ε p − ε k ) β= λ1 − λ 2 α=
În continuare, vom demonstra că : Rezolvarea ecuaţiei de gradul al doilea aX + bX + cI 2 = A , unde a, b, c ∈ R, a ≠ 0 , b 2 − 4ac ≥ 0 şi A ∈ M 2 (C) se reduce la rezolvarea unei ecuaţii binome. Demonstraţie: Într-adevăr, ecuaţia dată se poate scrie sub forma: 2 b2 1 b c 1 b c X 2 + X + I2 = A ⇔ ⇔ X + I 2 = A + 2 − I 2 . Cu notaţiile a a a 2a a a 4a 2
Y=X+
b 1 b 2 − 4ac I 2 şi B = A + I 2 , ecuaţia devine Y 2 = B , adică o ecuaţie 2a 4a 2 a
binomă.
34
1.6. Probleme rezolvate (1.1) 1 2 . R1.2.1. Să se determine toate matricele care comută cu matricea A = 3 4 Soluţie: a b astfel Fie X = încât A ·X = X ·A. Rezultă c d 1 2 a b a b 1 2 ⋅ = ⋅ sau 3 4 c d c d 3 4 a + 2c = a + 3b a=x b = 2y b + 2d = 2a + 4b 2c = 3b , deci , de unde rezultă sau c = 3 y 2 ( d − a ) = 3 b 3 a + 4 c = c + 3 d d = x + 3 y 3b + 4d = 2c + 4d 2y x = X = 3y x + 3y = yA + ( x − y ) I 2 .
R1.2.2. Fie A ∈ M 2 (C) şi mulţimea C ( A) = {X ∈ M 2 (C) AX = XA}. Să se arate că : a). Dacă A = kI 2 , k ∈ C, atunci C ( A) = M 2 (C); b). Dacă A ≠ kI 2 , k ∈ C, atunci C ( A) = {αA + βI 2 α , β ∈ C
}.
Soluţie: a). Evidentă; a b x y şi X = . Atunci, din AX = XA, rezultă: b). Fie A = c d z t ax + bz = xa + yc bz = cy ay + bt = xb + yd sau y (a − d ) = b( x − t ) . Dacă b = 0, se z (a − d ) = c( x − t ) cx + dz = za + tc cy + dt = zb + td y z t−x ajunge la o contradicţie cu ipoteza. Rezultă = = = α , α ∈ C, de unde b c d −a y = bα , z = cα , t = αd + ( x − αa) . 35
Fie αa + β X = cα
x − αa = β ,
atunci
x = αa + β y = bα z = cα t = αd + β
şi
bα a b 1 0 = α + β = αA + βI 2 . αd + β c d 0 1
R1.2.3. Să se determine toate matricele A ∈ M 2 (C) pentru care A2 = O2 . Soluţie: a 2 + bc = 0 a b b(a + d ) = 0 2 . Din egalitatea A = O2 , obţinem sistemul: Fie A = c d c ( a + d ) = 0 bc + d 2 = 0 Dacă a + d ≠ 0, atunci b = c = 0 şi a 2 = d 2 = 0 , de unde rezultă că a = d = 0, fals, căci a + d ≠ 0. Deci, a + d = 0 şi atunci d = –a iar din egalitatea a 2 + bc = 0 , 0 0 , c ∈ C, arbitrar. - dacă b = 0, rezultă a = 0 şi deci A = c 0 - dacă b ≠ 0, putem scrie c = −
a a2 şi atunci A = a 2 − b b
b , a, b∈ C, − a
b ≠ 0. Observaţie: O matrice A ∈ M 2 (C) cu proprietatea că există n∈ N* astfel încât An = O2 se numeşte matrice nilpotentă. (Am determinat toate matricele de ordinul doi nilpotente).
R1.2.4. Să se determine toate matricele A ∈ M 2 (C) pentru care A2 = I 2 . Soluţie: a 2 + bc = 1 a b b(a + d ) = 0 . Din egalitatea A2 = I 2 , rezultă sistemul: Fie A = c d c ( a + d ) = 0 bc + d 2 = 1 Dacă a + d ≠ 0, atunci b = c = 0 şi deci a 2 = d 2 = 1 , de unde rezultă că a = ±1 , d = ±1 . Cum 36
a+d≠0, obţinem a = 1, d = 1 sau a = –1, d
1 0 = I 2 , = –1 şi A = 0 1
−1 0 = − I 2 . A = 0 − 1 Dacă a + d = 0, atunci d = –a. Dacă b = 0, obţinem a 2 = d 2 = 1 şi atunci −1 0 1 0 sau A = cu c∈ C, arbitrar. A are forma A = c 1 c − 1 1 − a2 şi atunci matricea A are forma Dacă b ≠ 0, avem că c = b b a , a, b∈ C. A = 1 − a2 − a b Observaţie: O matrice A cu proprietatea că A2 = I 2 , se numeşte matrice involutivă, ce corespunde unei simetrii în plan. R1.2.5. Să se determine toate matricele A ∈ M 2 (C) cu proprietatea A2 = A . Soluţie: a 2 + bc = a a b b(a + d ) = b 2 . Din egalitatea A = A , rezultă sistemul: Fie A = c d c ( a + d ) = c bc + d 2 = d a 2 + bc = a b(a + d − 1) = 0 sau c(a + d − 1) = 0 (a − b)(a + d − 1) = 0 Dacă a + d – 1 ≠ 0, atunci b = c = 0, a = d ∈ {0,1} . Deci A = O2 sau A = I2. a − a2 2 Dacă a + d – 1 = 0, rezultă a + bc = a . Dacă b ≠ 0, atunci c = şi b b a cu A = a − a2 1− a b
37
0 0 , c∈ R a ∈ R, b ∈ R*. Dacă b= 0, atunci a = 0 sau a = 1 şi atunci A = c 1 1 0 , c∈ R. sau A = c 0 Observaţie: O matrice A cu proprietatea A2 = A se numeşte matrice idempotentă. O astfel de matrice corespunde aplicaţiilor de proiecţie în plan.
R1.2.6. Fie S2(C) = { A ∈ M 2 (C) │ A = tA } şi A2(C) = { A ∈ M 2 (C) │ A = − t A }. Să se arate că: a) A, B ∈ S2(C), atunci A + B ∈ S2(C), A, B ∈ A2(C), atunci A + B ∈ A2(C); b) A ∈ S2(C) ∩ A2(C), rezultă A = O2; c) ∀ M ∈ M 2 (C), există S ∈ S2(C) şi A ∈ A2(C) unice, astfel încât M = S + A. Soluţie: a). Fie A, B ∈ S2(C), atunci A = tA, B = tB şi A + B = tA + tB = t(A + B), adică A + B ∈ S 2(C). Fie A, B ∈ A2(C), atunci A = − tA, B = − tB şi A + B = − ( tA + tB) = − t (A + B), adică A + B ∈ A2(C); b). Fie A ∈ S2(C) ∩ A2(C), atunci A = tA şi A = − tA. Rezultă A = − A, de unde A = O2; 1 1 c). Pentru M ∈ M 2 (C), există S = (M + tM) şi A = (M – tM), unice, 2 2 astfel încât M = S + A.
a b ∈ M 2 (R). Să se arate că următoarele R1.2.7. Se dă matricea A = − b a afirmaţii sunt echivalente: a) Există n ∈ N* astfel încât An = I 2 ; b) Există q ∈ Q* astfel încât a = cos qπ , b = sin qπ . Soluţie: a). ⇒ b) Presupunem că există n ∈ N* astfel încât An = I 2 . Trecând la determinanţi obţinem (det A)n = 1 şi cum det A = a 2 + b 2 ≥ 0 deducem că det A = a 2 + b 2 = 1 , ceea ce arată că există t ∈ R astfel încât a = cos t, b = sint t.
38
cos kt sin kt cos t sin t , ∀k ∈ N*, şi atunci Ak = Deci, A = − sin kt cos kt − sin t cos t cos nt sin nt 1 0 = . De ceea ce arată că An = I 2 dacă şi numai dacă − sin nt cos nt 0 1 aici rezultă că cos nt = 1 şi sin nt = 0, adică nt = 2 pπ , p ∈ Z, de unde deducem 2p 2p t= π = qπ , unde q = ∈ Q şi prin urmare a = cos qπ , b = sin qπ . n n u cu u ∈ Z şi b). ⇒ a) Fie a = cos qπ , b = sin qπ cu q ∈ Q, adică q = v 2uπ 2uπ cos sin 2u 2 v 2 v . Rezultă şi atunci A = v ∈ N*. Putem scrie q = 2v − sin 2uπ cos 2uπ 2v 2v imediat că A2 v = I 2 şi deci luând n = 2v ∈ N*, deducem că An = I 2 . Probleme rezolvate (1.2)
a b unde a, b, c, d ∈ R, a + d ≠ 0. Să se arate că R1.4.1. Fie A = c d B ∈ M 2 (R) comută cu A dacă şi numai dacă comută cu A2. Soluţie: Din teorema lui Cayley – Hamilton, A2 − (a + d ) A + det A ⋅ I 2 = O2 , prin înmulţire la dreapta şi respectiv la stânga cu B se 2 2 obţine: A B − (a + d ) AB + B det A = O2 şi BA − (a + d ) BA + B det A = O2 . Scăzând cele două relaţii obţinem: A2 B − BA2 = (a + d )( BA − AB) şi de aici rezultă imediat concluzia cerută. R1.4.2. Arătaţi că pentru orice matrice A, B ∈ M 2 (R), există λ ∈ R astfel încât ( AB − BA) 2 = λI 2 . Soluţie: Dacă în relaţia lui Cayley – Hamilton, X 2 − Tr ( X ) ⋅ X + det X ⋅ I 2 = O2 , alegem X = AB – BA, obţinem: X ∈ M 2 (C), 2 ( AB − BA) − Tr ( AB − BA) ⋅ ( AB − BA) + det( AB − BA) ⋅ I 2 = O2 .
39
Cum Tr ( AB − BA) = Tr ( AB) − Tr ( BA) = 0 , rezultă ( AB − BA) 2 = λI 2 , unde λ = − det( AB − BA) .
a b , unde det A şi Tr A reprezintă R1.4.3. Fie A ∈ M 2 (C), A = c d determinantul şi respectiv urma matricei A (Tr A = a + d). Dacă Tr A · det A = 0 şi Tr A + det A ≠ 0, atunci matricea B ∈ M 2 (C) comută cu A, dacă şi numai dacă comută cu A3. Soluţie: Din condiţiile date rezultă că unul din factorii Tr A sau det A este nul. Dacă Tr A = 0 şi det A ≠ 0, atunci din relaţia lui Cayley – Hamilton, (1) A2 − TrA ⋅ A + det A ⋅ I 2 = O2 , rezultă A2 = − det A ⋅ I 2 , iar de aici obţinem A3 = A2 ⋅ A = −(det A) ⋅ A , A3 B = −(det A) ⋅ AB şi BA3 = −(det A) ⋅ BA . Scăzând ultimele două relaţii, obţinem: A3 B − BA3 = det A ⋅ ( BA − AB) şi de aici rezultă imediat concluzia dorită. Dacă det A = 0 şi Tr A ≠ 0, atunci din (1), obţinem: A2 B = (TrA) ⋅ AB A2 = (TrA) ⋅ A , de unde 2 (2) şi BA = ( TrA ) ⋅ BA A3 B = (TrA) ⋅ A2 B A3 = (TrA) ⋅ A2 , de unde 3 (3). 2 BA = (TrA) ⋅ BA Din relaţiile (2) şi (3) obţinem echivalenţa cerută.
R1.4.4. Fie A, B ∈ M 2 (C) astfel încât Tr(AB) = 0. Să se arate că ( AB) 2 = ( BA) 2 . Soluţie: Cum Tr(AB) = Tr(BA) = 0, atunci din relaţia lui Cayley – Hamilton, rezultă: ( AB) 2 + det( AB) ⋅ I 2 = O2 , ( BA) 2 + det( BA) ⋅ I 2 = O2 , iar de aici obţinem ( AB) 2 = ( BA) 2 , deoarece det(AB) = det A · det B = det (BA). Observaţie: Folosind inducţia matematică, se poate arăta că 2n ( AB) = ( BA) 2 n , n ∈ N*.
40
Probleme rezolvate (1.3)
− 2 4 . Să se calculeze An, n ∈ N*. R1.6.1. Fie matricea A ∈ M 2 (R), A = − 5 7 Soluţie: Ecuaţia caracteristică matricei A este λ2 − TrA ⋅ λ + det A = 0 , adică λ2 − 5λ + 6 = 0 , de unde rezultă λ1 = 2 şi λ2 = 3 . Rezultă că An are forma: An = 2 n ⋅ B + 3n ⋅ C , unde B, C ∈ M 2 (R) şi se determină din condiţiile n = 1 şi n − 2 4 2 B + 3C = A = 5 − 4 − 5 7 , = 2. Obţinem sistemul: , de unde B = 5 − 4 4 B + 9C = A2 = − 16 20 − 25 29 n n n 5 ⋅ 2 − 4 ⋅ 3 4 ⋅ 3 − 4 ⋅ 2n − 4 4 , n ∈ N*. şi atunci: An = C = n n n n 5 2 5 3 5 3 4 2 ⋅ − ⋅ ⋅ − ⋅ − 5 5 3 1 , iar n ∈ N*. R1.6.2. Să se calculeze An , unde A = − 3 − 5 Soluţie: Ecuaţia caracteristică matricei A este λ2 − TrA ⋅ λ + det A = 0 , adică λ2 + 4λ + 4 = 0 de unde rezultă că λ1 = λ2 = −2 , deci există matricele pătratice de ordinul doi B şi C, astfel încât An = (−2) n B + (−2) n−1 ⋅ n ⋅ C , ∀n ≥ 1 .
3 1 − 2 B + C = A = − 3 − 5 Pentru n = 1 şi n = 2, obţinem sistemul , de − − 8 12 2 4 B − 4C = A = 12 16 3 1 0 3 şi . B = C = Deci, unde obţinem că 0 1 − 3 − 3 3n 3n − 2 , ∀n ≥ 1 . An = (−2) n−1 − 3n − 3n − 2 R1.6.3. Fie m, n ∈ N* şi A, B ∈ M 2 (R) astfel încât Am B n = B n Am . Să se arate că dacă matricele Am şi Bn nu sunt de forma λ ⋅ I 2 , λ ∈ R, atunci AB = BA. 41
Soluţie: Se ştie că pentru orice k ∈ N, există ak , bk , ck , d k ∈ R astfel încât
Ak = ak A + bk I 2 şi B k = ck B + d k I 2 Atunci din Am B n = B n Am rezultă (am A + bm I 2 )(cn B + d n I 2 ) = (cn B + d n I 2 )(am A + bm I 2 ) sau am cn AB + am d n A + bm cn B + bm d n I 2 = cn am BA + cn bm B + d n am A + d nbm I 2 sau încă am cn ( AB − BA) = O2 , de unde rezultă că AB = BA, deoarece am cn ≠ 0 .
1 1 . Să se pună în evidenţă şirurile ( xn ) n≥1 şi R1.6.4. Fie matricea A = 0 1 x ( yn ) n≥1 astfel încât An = xn ⋅ A + yn ⋅ I 2 şi să se calculeze lim n . n→∞ y n Soluţie: Cum A2 − TrA ⋅ A + det A ⋅ I 2 = O2 , x1 = 1, y1 = 0, x2 = TrA = 2, det A = 1 = − y2 , rezultă ( xn+1 − TrAxn + + det Axn−1 = 0 , vezi teorema 1.5.3.) xn+1 = 2 xn + yn yn+1 = − xn , ∀n ≥ 1 sau xn+1 = 2 xn − xn−1 , ∀n ≥ 2 . Ecuaţia caracteristică asociată relaţiei de recurenţă liniară de ordinul II va fi r 2 − 2r + 1 = 0 , cu r1 = r2 = 1 , prin urmare xn = c1 + nc2 . Pentru n = 1 şi n = 2 obţinem c1 = 0, c2 = 1 , deci xn = n . Urmează
1 1 1 0 1 n + (− n + 1) = . yn = −(n − 1) şi An = n 0 1 0 1 0 1 x Obţinem lim n = −1 . n→∞ y n Probleme rezolvate (1.4)
R1.8.1. Fie şirurile ( xn ) n≥0 , ( yn ) n≥0 , date prin sistemul de recurenţă: x n +1 = x n + 2 y n , ∀n ≥ 0 cu x0 = 1, y0 = 2 . y n +1 = −2 x n + 5 y n Să se determine în funcţie de n, termenii generali ai şirurilor ( xn ) n≥0 ,
( y n ) n≥0 . 42
Soluţie: Observăm că ∆ = (TrA) 2 − 4 det A = 6 2 − 4 ⋅ 9 = 0 , deci putem aplica metoda expusă, iar sistemul de relaţii de recurenţă se poate scrie sub forma: x x x xn x 1 = A ⋅ n−1 , ∀n ≥ 1 sau n = An ⋅ 0 , n ≥ 0 sau încă n = An ⋅ , 2 yn yn−1 y0 yn yn
1 2 , deci totul revine la a afla pe An. unde A = − 2 5 Cum Tr A = 6 şi det A = 9, ecuaţia caracteristică este λ2 − 6λ + 9 = 0 , de unde rezultă λ1 = λ2 = 3 , adică An = 3n ⋅ B + n ⋅ 3n−1 ⋅ C , unde B şi C se obţin pentru n = 1 şi n = 2. Avem: 1 0 A = 3B + C şi , de unde obţinem: B = I = 2 2 2 0 1 A = 3 B + 2 ⋅ 3 ⋅ C − 2 2 . C = − 2 2 Rezultă 3n 0 − 2n3n−1 2n3n−1 3n−1 (3 − 2n) n ⋅ 2 ⋅ 3n−1 + An = n − 2n3n−1 2n3n−1 = − n ⋅ 2 ⋅ 3n−1 3n−1 (3 + 2n) . 0 3 n −1 n −1 1 x 3 (3 − 2n) n ⋅ 2 ⋅ 3 ⋅ , de unde obţinem: Deci n = n −1 n −1 3 (3 + 2n) 2 yn − n ⋅ 2 ⋅ 3 xn = 3n−1 (2n + 3) şi yn = 2 ⋅ 3n−1 ⋅ (n + 3), ∀n ≥ 0 .
R1.8.2. Să se determine limitele şirurilor ( xn ) n≥0 , ( yn ) n≥0 care verifică relaţiile: xn+1 = (1 − a ) xn + ayn , ∀n ≥ 0 , unde a, b ∈ (0,1), x0 , y0 ∈ R. y bx ( 1 b ) y = + − n + 1 n n Soluţie: Sistemul recursiv poate fi pus sub forma matriceală: a xn x xn+1 1 − a x = ⋅ sau n+1 = A ⋅ n , yn yn+1 b 1 − b yn yn+1 a 1 − a . A = b 1− b
43
unde
x x Rezultă n = An ⋅ 0 (1). Calculăm An . yn y0 Ecuaţia caracteristică a matricei A este λ2 − (2 − a − b)λ + 1 − a − b = 0 , de unde rezultă λ1 = 1 şi λ2 = 1 − a − b (r1 ≠ r2 , deoarece r2 = 1 − a − b < 1) .
Rezultă că An = 1n ⋅ B + (1 − a − b) n ⋅ C , unde B şi C se obţin pentru n = 1 şi n = 2. Rezolvând sistemul: 1 ⋅ B + (1 − a − b) ⋅ C = A 1 b a şi , rezultă B= 2 2 2 2 a + b b a 1 ⋅ B + (1 − a − b) ⋅ C = A 1 a − a , adică C= a + b 2 − b b An =
1 b a (1 − a − b) n + a + b b a a+b
a − a 1 b + a(1 − a − b) n = n − b b a + b b − b(1 − a − b)
a − a(1 − a − b) n a + b(1 − a − b) n
Ţinând cont de relaţia (1), rezultă 1 xn = (b + a (1 − a − b) n ) x0 + (a − a(1 − a − b) n ) y0 a+b 1 yn = (b − a (1 − a − b) n ⋅ b) x0 + (a + b(1 − a − b) n ) y0 , de a+b bx + ay0 bx + ay0 unde lim xn = 0 , lim yn = 0 , deoarece lim(1 − a − b) n = 0 n→∞ n → ∞ n →∞ a+b a+b ( 1 − a − b < 1) .
[
]
[
]
R1.8.3. Să se demonstreze că şirurile de numere reale care satisfac relaţiile 2 xn = 3 xn−1 + yn−1 2 yn = − xn−1 + 3 yn−1 , n ≥ 1 sunt periodice şi au aceeaşi perioadă. Soluţie: 3 1 xn = xn−1 + yn−1 2 2 sau Avem: 1 3 yn = − xn−1 + yn−1 , ∀n ≥ 1 2 2
xn = cos
π
6
yn = − sin
xn−1 + sin
π 6
π
6
xn−1 + cos
y n−1
π 6
yn−1 , ∀n ≥ 1
44
sau
π π sin cos xn xn−1 6 6 . = A ⋅ , n ≥ 1, A = π π y y − sin n n−1 cos 6 6 nπ nπ cos sin x x x n n 0 6 6 ⋅ 0 . Rezultă = A ⋅ = π π n n y0 yn y 0 − sin cos 6 6 nπ nπ x n = cos ⋅ x0 + sin ⋅ y 0 şş Obţinem 6 6 nπ nπ y n = − sin ⋅ x0 + cos ⋅ y0 , n ≥ 1 . 6 6 Deoarce xn+12 = xn şi yn+12 = yn , ∀n ≥ 0 , rezultă că cele 2 şiruri sunt periodice de perioadă 12. R1.8.4. Fie funcţia f ( x) = ( f o f o ... o f )( x) = f n ( x) , 142 4 43 4
4x + 1 , unde x este astfel ales încât să aibă sens 2x + 3 ∀n ∈ N*. Să se determine funcţia
n ori
f n = ( f o f o ... o f ) . 142 4 43 4 n ori
Soluţie: Aşa cum am văzut, prin compunerea unei funcţii omografice cu ea însăşi ax + b de n ori, se obţine tot o funcţie omografică: dacă f ( x) = , a, b, c, d ∈ R, cx + d a x + bn , unde an , bn , cn , d n sunt elementele atunci f n ( x) = ( f o f o ... o f )( x) = n 142 4 43 4 c x d + n n n ori
a matricei A = n cn n
n
bn a b = . d n c d
4 1 . Conform celor expuse, problema revine la a calcula An, unde A = 2 3 Folosim ecuaţia caracteristică a matricei A. Avem λ2 − TrA ⋅ λ + det A = 0 , adică λ2 − 7λ + 10 = 0 , cu rădăcinile λ1 = 2 şi λ2 = 5 . Deci An = 2 n ⋅ B + 5n ⋅ C , unde B, C ∈ M 2 (C), şi se determină pentru n = 1 şi n = 2. 45
Obţinem sistemul : 4 1 2 B + 5C = 2 3 , care 4 B + 25C = 18 7 14 11 2 1 C = 3 3. 2 1 3 3 1 2 1 − 3 + 5n 3 Deci , An = 2 n 3 2 − 2 2 3 3 3 adică
1 rezolvat dă B = 3 − 2 3
1 n n 3 = 1 2 + 2 ⋅ 5 1 3 − 2 n+1 + 2 ⋅ 5n 3
1 − 3 şi 2 3
− 2 n + 5n , 2 n+1 + 5n
(2 n + 2 ⋅ 5n ) x + (5n − 2 n ) f n ( x) = ( f o f o ... o f )( x) = , ∀n ∈ N*. n n +1 n +1 n 142 4 43 4 ( 2 ⋅ 5 − 2 ) x + ( 2 + 5 ) n ori 2 xn + 1 , ∀n ∈ N. Să 2 xn + 3 se găsească expresia termenului general xn şi să se calculeze lim xn . R1.8.5. Fie şirul ( xn ) n≥0 definit prin x0 = a > 0 şi xn+1 =
n→∞
Soluţie:
Conform celor expuse, avem xn =
an x0 + bn , unde an , bn , cn , d n sunt c n x0 + d n n
a bn 2 1 = . Calculăm An folosind ecuaţia elementele matricei A = n cn d n 2 3 caracteristică a matricei A. Avem λ2 − TrA ⋅ λ + det A = 0 , adică λ2 − 5λ + 4 = 0 , de unde λ1 = 1 şi λ2 = 4 . Deci An = 1n ⋅ B + 4 n ⋅ C , unde B, C ∈ M 2 (C), şi se determină pentru n = 1 şi n = 2. Obţinem sistemul : B + 4C = A 1 2 − 1 1 1 1 şi C = . , de unde B = 2 3 − 2 1 3 2 2 B + 16C = A n
46
Prin urmare, − 1 + 4n 1 2 − 1 n 1 1 1 1 2 + 4 n , de unde rezultă + 4 ⋅ = An = 3 2 2 3 − 2 + 2 ⋅ 4 n 1 + 2 ⋅ 4 n 3 − 2 1 (2 + 4 n ) x0 + (4 n − 1) xn = , iar de aici obţinem 2(4 n − 1) x0 + (2 ⋅ 4 n + 1) x +1 1 = . lim xn = 0 n→∞ 2 x0 + 2 2 R1.8.6. Găsiţi toate numerele naturale nenule n astfel încât n +1 şi 3n +1 să fie simultan pătrate perfecte. Soluţie: Dacă n + 1 = x 2 şi 3n + 1 = y 2 , atunci 3x 2 − y 2 = 2 , ecuaţie ce este 1 1 echivalentă cu ecuaţia Pell u 2 − 3v 2 = 1 , unde u = (3x − y ) şi v = ( y − x) . 2 2 2 2 Cum soluţia minimă pozitivă a ecuaţiei u − 3v = 1 , este u1 = 2 , v1 = 1 şi d = 3, rezultă că soluţia generală a acestei ecuaţii este (u k , vk ) k ≥1 , unde 1 uk = (2 + 3 ) k + (2 − 3 ) k 2 1 vk = (2 + 3 ) k − (2 − 3 ) k , ∀k ≥ 1 . 2 3 Deci obţinem: 1 nk = xk2 − 1 = (u k + vk ) 2 − 1 = (2 + 3 ) 2 k +1 + (2 − 3 ) 2 k +1 − 4 , ∀k ≥ 1 . 6
[
]
[
]
[
]
Probleme rezolvate (1.5)
4 6 , n ∈ N*. R1.10.1 Să se rezolve în M 2 (R) ecuaţia: X n = 8 12 Soluţie: a b cu Evident det( X n ) = 0, (det X ) n = 0 de unde det X = 0. Fie X = c d ad – bc = det X = 0. Utilizând relaţia lui Cayley – Hamilton, rezultă a b a b = (TrA) n−1 şi se obţine sistemul X n = (a + d ) n−1 c d c d
47
(a + d ) n−1 a = 4 n −1 (a + d ) b = 6 n −1 (a + d ) c = 8 (a + d ) n−1 d = 12
(1) ( 2) (3)
.
( 4) 1 n
Din ecuaţiile (1) şi (4) rezultă (a + d ) = 16 , de unde a + d = 16 şi atunci n
(a + d ) n−1 = 16 c=
n −1 n
= k care înlocuit în (1) – (4), obţinem a =
4 6 , b= , k k
8 12 ,d = . k k n −1 1 4 6 , k = 16 n . Deci, soluţia ecuaţiei este X = k 8 12
1 − 3 are exact R1.10.2. Să se determine a ∈ Z ştiind că ecuaţia X 2 = 3 7a două soluţii în M 2 (C). Soluţie: Fie X o soluţie a ecuaţiei date, d = det X şi t = Tr X. Atunci, cum −3 1 + d , deci t 2 = 7a + 2d + 1 (am X 2 − tX + dI 2 = O2 , rezultă că tX = 3 7 a + d trecut la urma matricelor). Dacă 7 a + 2d + 1 ≠ 0 , există t1 , t 2 ∈ C*, t1 ≠ t 2 astfel încât t12 = t 22 = 7a + 2d + 1 . Cum 1 − 3 = 7a + 9 ≠ 0 , rezultă d ∈ {d1 , d 2 } unde d 2 = det 2 X = det X 2 = det 3 7a d12 = d 22 = 7a + 9 şi d1 ≠ d 2 . Rezultă 1 1 + d1 − 3 1 1 + d 2 − 3 1 1 + d1 , , X ∈ 3 7 a d 3 7 a d + + t t 1 1 t3 3 1 2
−3 1 , 7a + d 2 t 4
1 + d 2 3
− 3 7a + d 2
cu t12 = t 22 = 7a + 2d1 + 1 , t32 = t 42 = 7a + 2d 2 + 1, t1 ≠ t 2 , t3 ≠ t 4 . Se verifică cu uşurinţă că cele patru matrice sunt distincte şi sunt soluţii ale ecuaţiei date. Cum ecuaţia are două soluţii, atunci 7 a + 2d1 + 1 = 0 sau
48
7 a + 2d 2 + 1 = 0 .
Rezultă
(7 a + 2d1 + 1)(7a + 2d 2 + 1) = 0 ,
deci
5 (7a + 1) 2 − 4(7a + 9) = 0 ⇔ a ∈ 1,− . 7 1 − 3 are exact Cum a ∈ Z, obţinem a = 1. Pentru a = 1, ecuaţia X 2 = 3 7 două soluţii: 1 5 − 3 şi X 2 = − X 1 . X 1 = 4 3 11 R1.10.3. Fie t ∈ (0, π ) un număr real fixat. Să se determine toate matricele cos t − sin t . X ∈ M 2 (R) care verifică ecuaţia X n = sin t cos t Soluţie: cos t − sin t a b Dacă notăm cu A = şi X = atunci sin t cos t c d X n+1 = A ⋅ X = X ⋅ A sin t ≠ 0 b sin t = −c sin t a =d a − b ⇔ . ⇔ deci X = − a sin t = −d sin t c = −b b a Din X n = A rezultă (det X ) n = det A = 1 , adică det X ∈ {± 1} ⇔ a 2 + b 2 ∈ {± 1}, prin urmare a 2 + b 2 = 1 , deci există x ∈ R astfel ca a = cos cos x − sin x , x, b = sin x şi atunci X = sin x cos x cos nx − sin nx cos t − sin t . = X n = sin nx cos nx sin t cos t Deci nx = t + 2kπ , k ∈ Z.
Ecuaţia xk =
t + 2kπ . n
are
n
soluţii
cos xk X k = sin xk
49
− sin xk ; k = 0, n − 1 cos xk
unde
3 − 1 , n ∈ N, n ≥ 2 , nu are soluţii în R1.10.4. Să se arate că ecuaţia X n = 0 0 M 2 (Q). Soluţie: x y 3 − 1 x y x y 3 − 1 , atunci din rezultă z = Fie X = z t 0 0 z t z t 0 0 y 0 1 x . = xI 2 + yA , unde A = = 0, t = x + 3y şi deci X = 0 3 0 x + 3y xI 2 ⋅ yA = yA ⋅ xI 2 , rezultă că Deoarece n
X n = ( xI 2 + yA) n = ∑ Cnk x n−k y k Ak . k =0
0 3 = 3 A , Ak = 3k −1 A, k ≥ 1 , prin urmare A2 = deci 0 9 n 1 1 X n = x n I 2 + ∑ Cnk x n−k (3 y ) k A = = x n I 2 + ( x + 3 y) n − x n A . Obţinem 3 k =1 3 n 1 x ( x + 3 y)n − x n X n = adică x n = 3 , deci x ∉ Q, ceea ce înseamnă că 3 0 ( x + 3 y)n ecuaţia dată nu are soluţii în M 2 (Q). Dar
[
[
]
]
1 2 . R1.10.5. Fie matricea A = 0 1 a). Să se determine matricea X ∈ M 2 (C) astfel încât XA = AX; b). Să se rezolve în M 2 (C) ecuaţia Z n = A . Soluţie: a b 1 2 a b a b 1 2 , AX = XA, adică , de = a). Fie X = c d 0 1 c d c d 0 1 a + 2c = a c = c c = 0 unde obţinem sistemul . Acesta devine , rezultă b + 2 d = 2 a + b d = a d = d 0 b a b . = aI 2 + B , unde B = X = 0 0 0 a 50
a b = aI 2 + B . Cum b). Z n = A rezultă Z n+1 = AZ = ZA , atunci Z = 0 a 0 b 0 0 , B 2 = şi B n = O2 , ∀n ≥ 2 , prin urmare B = 0 0 0 0 a n na n−1b 1 = Z n = (aI 2 + B) n = a n I 2 + Cn1 a n−1 B = a n 0 0 2kπ 2kπ a = cos + i sin n a = 1 n n , de unde n−1 π 2 a 2 2 k 2kπ na b = 2 b = = cos + i sin n n n n
2 . Rezultă sistemul 1
, k = 0, n − 1 .
R1.10.6. Fie n ∈ N, n ≥ 3 . Să se determine X ∈ M 2 (R) astfel încât: 1 − 1 . X n + X n−2 = −1 1 Soluţie: a b Fie X = o soluţie a ecuaţiei. Avem c d X n + X n−2 = X n−2 ( X + iI 2 )( X − iI 2 ) , deci luând determinantul ambilor membri vom avea sau det (X) = 0 sau det( X + iI 2 ) = 0 sau det( X − iI 2 ) = 0 . În cazul det( X + iI 2 ) = 0 ar rezulta (a+i)(d+i) – bc = 0 adică ad – bc – 1 = 0 şi a + d = 0. Obţinem d = –a şi bc = −1 − a 2 . Prin calcul obţinem a 2 + bc b(a + d ) − 1 0 2 = = − I 2 , prin urmare X = 2 + + c ( a d ) d bc 0 − 1 X n−2 ( X 2 + I 2 ) = O2 , fals. Similar avem det( X − iI 2 ) ≠ 0 . Rămâne că det (X) = 0. Teorema lui Cayley-Hamilton, adică relaţia 2 X = (a + d ) X − det( X ) I 2 , ne spune că X 2 = (a + d ) X , X 3 = (a + d ) 2 X ,... 1 − 1 . Notăm a + d = t şi Deci X n + X n−2 = (a + d ) n−1 + (a + d ) n−3 X = −1 1
[
]
a(t n−1 + t n−3 ) = 1 , b(t n−1 + t n−3 ) = −1 , prin identificare va rezulta: c(t n−1 + t n−3 ) = −1 , d (t n−1 + t n−3 ) = 1 . Adunăm prima şi ultima relaţie şi obţinem
51
cu ajutorul funcţiei f: R → R, f ( x) = x n + x n−2 − 2 relaţia f(t) = 0. Avem f ' ( x) = x n−3 (nx 2 + n − 2) . Cazul I: n este par. Avem f ' ( x) > 0 pe (0, ∞) şi f ' ( x) < 0 pe (−∞,0) . Cum f (–1) = f (1) = 0, rezultă că în acest caz –1 şi 1 sunt singurele rădăcini ale lui f. Obţinem din relaţiile precedente a, b, c şi d soluţiile t = 1, 1 1 − 1 1 1 − 1 şi t = –1, X 2 = − . X 1 = 2 −1 1 2 − 1 1 Cazul II: n este impar. Avem f ' ( x) > 0 pentru x ≠ 0 şi 1 este singura 1 1 − 1 . rădăcină a lui f. În acest caz unica soluţie este X = 2 − 1 1
52
2. Matrice de ordinul n. Valori şi vectori proprii 2.1 Valori proprii şi vectori proprii pentru matrice pătratice Fie A ∈ M n (C) o matrice pătratică. Definiţie 2.1.1. Un număr λ ∈ C se numeşte valoare proprie pentru matricea A, dacă există un vector nenul X ∈ M n,1 (C) (matrice coloană) astfel încât AX = λX . Un astfel de vector X se numeşte vector propriu pentru matricea A corespunzător valorii proprii λ . Observaţie 2.1.2. : 1). O relaţie de forma AX = λX , X = On,1, unde A ∈ M n (C), λ ∈ C,
X ∈ M n,1 (C) o numim relaţie de tip valoare proprie – vector propriu. 2). Dacă X1,X2 sunt vectori proprii pentru A corespunzători aceleiaşi valori proprii λ , atunci pentru orice a1 , a2 ∈ C, vectorul X = a1 X 1 + a2 X 2 este vector propriu pentru A. 3). Mulţimea tututor valorilor proprii pentru o matrice A, se numeşte spectrul matricei A şi se notează cu Spec (A). Proprietate 2.1.3.: Dacă A ∈ M n (C), λ ∈ C este valoare proprie pentru A iar X ∈ M n,1 (C) este vector propriu corespunzător, atunci: a). Pentru orice k ∈ N, numărul λk este valoare proprie pentru matricea Ak , iar X este vector propriu pentru Ak ; b). Pentru orice polinom p ∈ C[X] numărul p(λ ) este valoare proprie pentru matricea p ( A) , iar X este vector propriu pentru p ( A) ; c). Dacă A este inversabilă, atunci λ ≠ 0 (o matrice inversabilă nu are 1 valoare proprie pe 0) şi numărul este valoare proprie pentru matricea A−1 ,
λ
−1
iar X este vector propriu pentru A . Demonstraţie: a). Din AX = λX , X ≠ On,1, prin inducţie după k ∈ N* rezultă Ak X = λk X , X ≠ On,1, care este o relaţie de tip valoare proprie – vector propriu ce afirmă că λk este valoare proprie pentru matricea Ak , iar X este vector propriu corespunzător; b). Dacă p( X ) = a0 + a1 X + ... + ak X k , atunci p( A) = a0 I n + a1 A + ... + ak Ak
iar de aici rezultă
p ( A) ⋅ X = a0 I n X + a1 AX + ... + ak Ak X = = a0 X + a1λ X + ... + ak λ k X = (a0 + a1λ + ... + ak λ k ) X = p(λ ) X
53
X ≠ On ,1 , adică p(λ ) este valoare proprie pentru matricea p(A), iar X este vector propriu pentru p(A); c). Dacă prin absurd, am presupune λ = 0 , atunci din AX = 0 rezultă −1 A AX = 0 sau X = On,1, contradicţie. Deci, λ ≠ 0 şi atunci din AX = λX 1 rezultă X = A−1λX = λA−1 X sau A−1 X = X , X ≠ On ,1 , care este o relaţie de
λ
tip valoare proprie – vector propriu. Observaţii 2.1.4.: 1). Parţial, afirmaţiile din proproziţia de mai sus, admit şi reciproce. Astfel: a). Singurele valori proprii ale matriei Ak sunt de forma λk , unde λ este valoare proprie pentru A. b). Singurele valori proprii ale matricei p(A) sunt de forma P(λ ) , unde λ este valoare proprie pentru A. 1 c). Singurele valori proprii ale matricei inverse A−1 sunt de forma ,
λ
unde λ este valoare proprie pentru A. În schimb, vectorii proprii nu sunt totdeauna aceeaşi. (În general, mulţimea vectorilor proprii pentru matricea Ak sau p(A) include strict mulţimea vectorilor proprii ai matricei A). 2). În definiţia dată, noţiunile valori proprii şi vectori proprii pentru o matrice sunt definite simultan. Se poate da o definiţie independentă pentru valorile proprii, după cum reiese din următoarea: Teoremă 2.1.5. Un număr λ ∈ C este valoare proprie pentru matricea A ∈ M n (C) dacă şi numai dacă det( A − λI n ) = 0 . Demonstraţie: Relaţia AX = λX , X ≠ On ,1 se poate scrie det( A − λI n ) X = On ,1 , X ≠ On ,1 , care poate fi privită ca un sistem de n ecuaţii cu n necunoscute (x1, x2, x1 x ..., xn), unde X = 2 şi condiţia X ≠ On ,1 , cere ca el să admită soluţia M x n
nebanală. Aceasta este echivalentă cu condiţia ca determinantul matricei coeficienţilor sistemului să fie egal cu zero, adică det( A − λI n ) = 0 .
54
2.2. Polinom caracteristic al unei matrice pătratice
Fie A ∈ M n (C) o matrice pătratică de ordin n ∈ N*. Definiţie 2.2.1. a). Matricea ( A − λI n ) ∈ M n (C), λ ∈ C, se numeşte matrice caracteristică a matricei A ( λ - matrice); b). Polinomul f A ∈ C[X], f A ( X ) = det ( A − XI n ) se numeşte polinom caracterstic al matricei A; c). Ecuaţia polinomială f A ( x) = 0 , se numeşte ecuaţia caracteristică a matricei A. Observaţie 2.2.2.: Conform teoremei, valorile proprii ale matricei A sunt rădăcinile polinomului caracteristic sau ale ecuaţiei caracteristice. Expresia canonică a polinomului caracteristic Proprietate 2.2.3.: Dacă A ∈ M n (C), atunci
f A ( X ) = (−1) n ( X n − σ 1 X n−1 + σ 2 X n−2 − K + (−1) n−1σ n−1 X + (−1) n σ n ) , unde σ k este suma tuturor minorilor diagonali de ordin k din matricea A (un minor diagonal este format cu linii şi coloane de aceeaşi indici). Demonstraţie: Dacă notăm cu A1, A2,..., An coloanele matricei A şi cu B1, B2,..., Bn coloanele matricei B = − XI n , matricea caracteristică va fi A − λI n = ( A1 + B1 , A2 + B2 , K , An + Bn ) . Determinantul ei se descompune în sumă de 2n determinanţi de forma det (C1, C2,..., Cn) în care coloana Ck este Ak sau Bk. Grupăm în această sumă de determinanţi, cei ce conţin acelaşi număr de coloane din matricea B, determinanţi ce conţin k coloane din B = − XI n , se dă factor (− X ) k de pe cele k coloane şi dezvoltând acest determinant pe rând după fiecare din cele k coloane, obţinem un minor de ordin (n – k) din matricea A. Se obţine: n
det( A − XI n ) = det A − X ∑ det( A1 , K , Ek , K , An ) + (− X ) 2 ∑ det( A1 , K , Ei , K , E j , K , An ) + K + (− X ) n−1 ⋅ k =1
i< j
n
⋅ ∑ ( E1 , K , Ak , K , En ) + (− X ) n det( E1 ,..., En ) = det( A − Xσ n−1 + X 2σ n −2 − K + (−1) n −1 X n−1σ 1 + (−1) n X n ) = k =1
[
]
= ( −1) n X n −σ 1 X n −1 + σ 2 X n−2 − K + (−1) n−1σ n−1 X + (−1) n σ n , unde σ n = det A şi E1, E2,..., En sunt coloanele matricei In. Observaţie 2.2.4.: Dintre coeficienţii polinomului caracteristic remarcăm:
55
n
not
σ 1 = ∑ aii = Tr ( A) , numit urma matricei A (suma elementelor i =1
de pe diagonală – minorii diagonali de ordinul unu); aii aij σ2 = ∑ = (aii aij − aij a ji ) a jj 1≤∑ 1≤i < j ≤ n a ji i< j ≤n
(suma
minorilor
diagonali de ordinul doi) σ n = det A , singurul minor (şi diagonal) de ordin n. 2.2.5. Legătura între coeficienţii polinomului caracteristic şi valorile proprii ale matricei
Ecuaţia
caracteristică
a
matricei
A∈ Mn
(C),
este:
(1)
p ( x) = x − σ 1 x + σ 2 x − K + (−1) σ n−1 x + + (−1) σ n = 0 , care este o ecuaţie algebrică de gradul n şi are în mulţimea numerelor complexe n rădăcini (unele eventual multiple), care sunt valorile proprii ale matricei. Dacă λ1 , λ2 , K , λn sunt cele n valori proprii, atunci descompunerea polinomului P în factori inductibili în C (de gradul I) este: p( X ) = ( X − λ1 ) ⋅ ( X − λ2 ) ⋅ K ⋅ ( X − λn ) care dezvoltat dă (2) n
n −1
n−2
n −1
n
p( X ) = X n − S1 X n−1 + S 2 X n−2 − K + (−1) n−1 S n−1 X + (−1) n S n , unde n
S1 = λ1 + λ2 + K + λn = ∑ λi
S2 =
∑λ λ
1≤i < j ≤ n
i
i =1
j
...... n
S n = λ1 ⋅ λ2 ⋅ K ⋅ λn = ∏ λi , sunt sumele simetrice (Viète) ale i =1
valorilor proprii λ1 , λ2 , K , λn . Identificând exprimările (1) şi (2) ale polinomului P, obţinem: σ k = S k , k = 1, n . În
particular,
n
σ 1 = S1
sau
Tr ( A) = ∑ λ1
,
adică
i =1
a11 + a22 + K + ann = λ1 + λ2 + K λn (suma valorilor proprii este egală cu urma matricei A). σ 2 = S 2 , atunci ∑ (aii a jj − aij a ji ) = ∑ λi λ j . 1≤i < j ≤ n
1≤i < j ≤ n
56
σ n = S n , det A = λ1 ⋅ λ2 ⋅ K ⋅ λn (determinantul unei matrice pătratice este egal cu produsul valorilor proprii ale ei). În particular, o matrice A ∈ M n (C) este inversabilă dacă şi numai dacă toate valorile proprii sunt nenule. Observaţii 2.2.6.: a b , avem 1). Pentru matricea de ordinul doi, A = c d f A ( X ) = X 2 − (a + d ) X + ad − bc = X 2 − − (TrA) X + det A ; a11 2). Pentru matricea de ordinul trei, A = a21 a 31 3
3
i =1
i =1
f A ( X ) = − X 3 + ∑ aii X 2 − ∑ ∆ ii X +
a22 a32
a13 a23 , avem a33
+ det A , unde ∆ ii
este minorul
a12
corespunzător elementului aii (obţinut din matricea A prin eliminarea liniei i şi coloanei i) sau f A ( X ) = − X 3 + (TrA) X 2 − (TrA* ) X + det A , unde A* este reciproca matricei A ( A ⋅ A* = det A ⋅ I 3 ). Proprietate 2.2.7.: Două matrice asemenea au acelaşi polinom caracteristic. Demonstraţie: Dacă A, B ∈ M n (C) sunt matrice asemenea atunci există o matrice B = P −1 AP . Rezultă nesingulară P astfel încât −1 −1 −1 f B ( X ) = det( P AP − XI n ) = det( P ( A − XI n ) P) = det P ⋅ det( A − XI n ) ⋅ det P = = det( A − XI n ) = f A ( X ) . Observaţie 2.2.8.: Reciproca nu este în general adevărată. Există matrice cu acelaşi polinom caracteristic, dar care nu sunt asemenea. De exemplu, A = In, 1 0 K 0 1 0 1 K 0 0 n B= ∈ M n (C). Avem f A ( X ) = f B ( X ) = = (1 − X ) , iar KKK 0 0 K 0 1 relaţia B = P −1 AP dă B = In, care este falsă. Proprietate 2.2.9.: Dacă A, B sunt matrice pătratice, atunci polinoamele caracteristice ale matricelor produs A·B şi B·A coincid.
57
Demonstraţie: Dacă una din matricele A sau B este inversabilă, atunci matricele produs A·B şi B·A sunt asemenea, conform relaţiei AB = B −1 ( BA) B sau BA = A−1 ( AB) A , deci ele au acelaţi polinom caracteristic ( f AB = f BA ). Să considerăm matricea A(a) = A – aIn. Dacă a nu este valoarea proprie pentru matricea A, atunci matricea A(a) este inversabilă, deci pentru orice a ∈ C – Spec(A) = C – {λ1 A , λ2 A , K , λnA } , avem f A( a ) B = f BA( a ) sau
, de unde det( A(a) B − xI n ) = det( BA(a) − xI n ) det( AB − aB − xI n ) = det( BA − aB − xI n ) , egalitate care are loc pentru orice x şi pentru orice a ∈ C – Spec(A). Cei doi membri ai egalităţii fiind polinoame de grad ≤ n atât în a cât şi în x, condiţia de a fi egale în mai mult de n valori ale lui a, revine la identitatea lor, deci det( A(a) B − xI n ) = det( BA(a) − xI n ) pentru orice a ∈ C, inclusiv pentru a = 0 care dă det( AB − xI n ) = det( BA − xI n ), x ∈ C. Observaţie 2.2.10.: Dacă matricele A ∈ M m ,n (C), B ∈ M n ,m (C) nu sunt pătratice (m ≠ n), atunci ele nu au polinom caracteristic. În schimb, matricele AB ∈ M m (C) şi BA ∈ M n (C) sunt pătratice. Se pune problema dacă se poate găsi o legătură între polinoamele caracteristice f AB şi f BA , care sunt de grade diferite. Folosind produsul matricelor cu blocuri şi proprietatea X Y = det X ⋅ det Z (X ∈ M n (C), Z ∈ M m (C)), obţinem: det O Z Proprietate 2.2.11.: Dacă A ∈ M m ,n (C), B ∈ M n ,m (C), atunci între polinoamele caracteristice ale matricelor produs există relaţia: n m (− X ) f AB ( X ) = (− X ) f BA ( X ) . Demonstraţie: Se verfică egalitatea matriceală −A AB − XI m − A I m O I m O − XI m ⋅ = ⋅ din care − XI n B I n B I n O O BA − XI n trecând la determinanţi, det( AB − XI m ) ⋅ det(− XI n ) ⋅ det( I m ) ⋅ det( I n ) = det( I m ) ⋅ det( I n ) ⋅
rezultă:
⋅ det(− XI m ) ⋅ det( BA − XI n ) sau (− X ) n f AB ( X ) = (− X ) m f BA ( X ) . Reamintim că pentru o matrice A ∈ M n (C), A = (aij ) i , j =1,n , definim matricea adjunctă A* = ( A) t = = (a i , j ) i , j =1,n .
58
O matrice A ∈ M n (C) se numeşte: a). autoadjunctă (hermetiană), dacă A* = A; b). antiautoadjunctă (antihermetiană), dacă A* = –A; c). unitară, dacă A* · A = In (A* = A–1). În cazul când A ∈ M n (R), se folosesc denumirile: a). simetrică, dacă tA = A (A* = tA); b). antisimetrică, dacă tA = –A; c). ortogonală, dacă tA · A = In (tA = A–1). Se pot da câteva rezultate generale asupra valorilor proprii ale matricelor x1 y1 x2 y remarcabile. Astfel, pentru doi vectori X, Y ∈ M n ,1 (C), X = , Y = 2 , M M x y n n n
definim produsul scalar < X , Y >= ∑ xk y k . k =1
Se verfică uşor relaţiile: a). < X +Y, Z > = < X, Z > + < Y, Z >, b). < X, Y > = < Y , X > , c). < aX, Y > = a < X, Y >, d). < X, aY > = a < X , Y > , e). < X , X >≥ 0 şi < X , X >= 0 ⇔ X = On ,1 . Relaţiile au loc pentru orice X, Y, Z ∈ M n ,1 (C), a ∈ C. Observaţie 2.2.12.: Dacă A ∈ M n (C), atunci < A·X, Y > = < X, A*Y >, pentru orice X, Y ∈ M n ,1 (C). n n n Într-adevăr, < AX , Y >= ∑ ∑ akp x p y k = ∑ akp x p y k iar < X, A*Y > k =1 p =1 k , p =1 n
n
p =1
k =1
= ∑ x p ∑ a kp yk =
n
∑a
k , p =1
kp
xp yk .
Proprietate 2.2.13.: Toate valorile proprii ale unei matrice hermetiene sunt numere reale. Demonstraţie: Fie λ ∈ C valoare proprie şi X ≠ On ,1 vector propriu, deci AX = λX .
59
Avem < AX, X > = < X, A*X >, sau < AX, X > = < X, AX >, < λX , X >=< X , λX > , sau λ < X , X >= λ < X , X > de unde λ = λ , adică λ ∈ R. Proprietate 2.2.14.: Toate valorile proprii ale unei matrice antihermetiene sunt numere imaginare (cu partea reală zero). Demonstraţie: Fie AX = λX , λ ≠ 0 , atunci < AX, X > = < X, A*X > sau < AX, X > = < X, –AX > sau < λX , X >= =< X ,−λX > , sau λ < X , X >= −λ < X , X > de unde
λ = −λ , adică λ = i ⋅ b, b ∈ R. Proprietate 2.2.15. Toate valorile proprii ale unei matrice unitare, au modulul unu. Demonstraţie: Fie AX = λX , X ≠ On ,1 , atunci < AX, AX > = < X, A*(AX) > = < X, X >,
obţinem < λX , λX >=< X , X > sau λ λ < X , X >=< X , X > , adică λ ⋅ λ = 1 , de unde rezultă λ = 1 . Observaţii 2.2.16.: 1). Dacă A ∈ M n (R) şi tA = A, atunci ecuaţia det( A − xI n ) = 0 , are toate rădăcinile reale; 2). Dacă A ∈ M n (R) şi tA = –A, atunci ecuaţia det( A − xI n ) = 0 , are toate rădăcinile de forma λ = i ⋅ b , b ≠ 0 (are partea reală zero); 3). Dacă A ∈ M n (R) este inversabilă şi tA = A–1, atunci ecuaţia det( A − xI n ) = 0 , are toate rădăcinile de forma x = cos α ± i sin α , α ∈ R (rădăcinile nereale se cuplează în perechi de forma x1 = cos α + i sin α , x2 = cos α − i sin α , iar cele reale nu pot fi decât de 1 sau –1). 2.3. Teorema lui Cayley-Hamilton Corp de numere Definiţie 2.3.1. O submulţime K a lui C, cu cel puţin două elemente, se numeşte corp de numere, dacă îndeplineşte condiţiile: 1). ∀x, y ∈ K rezultă x + y, xy ∈ K; 2). ∀x ∈ K rezultă –x ∈ K; 3). ∀x ∈ K, x ≠ 0 rezultă x −1 ∈ K. Proprietate 2.3.2. Pentru orice corp de numere K avem:
60
a). 0 ∈ K, 1 ∈ K; b). Q ⊆ K. Demonstraţie: a). Cum K ≠ Ø putem considera un element a ∈ K. Atunci – a ∈ K şi deci 0 = a + (–a) ∈ K. Conform definiţiei lui K, putem alege b ∈ K, b ≠ 0. Avem b −1 ∈ K, deci 1 = bb −1 ∈ K. b). Fie n ∈ N. Dacă n ∈ K, atunci şi n + 1 ∈ K căci 1 ∈ K. Se verifică astfel prin inducţie matematică că N ⊆ K. Din N ⊆ K rezultă că –n ∈ K oricare ar fi m cu m, n ∈ Z, n ≠ 0. Atunci n ∈ N , deci Z ⊆ K. Fie acum x ∈ Q, x = n x = mn −1 ∈ K, deci Q ⊆ K. Exemple 2.3.3.: 1). Mulţimile Q, R, C sunt corpuri de numere; 2). Mulţimile Q 2 = a + b 2 a, b ∈ Q , Q(i ) = {a + bi a, b ∈ Q} sunt
( ) {
}
corpuri de numere. Fie K un corp de numere. Vom nota cu K[X] mulţimea tuturor polinoamelor în nedeterminată X cu coeficienţi în K. Evident K[X] ⊆ C[X] şi oricare ar fi f,g∈ K[X], polinoamele f + g, fg, –f aparţin lui K[X]. Invocând proprietăţi de închidere ale operaţiilor cu numere din K şi algoritmul împărţirii euclidiene (împărţirea cu rest) a polinoamelor din C[X], rezultă că oricare ar fi polinoamele f, g ∈ K[X], g ≠ 0, există şi sunt unic determinate polinoamele q, r ∈ K[X] astfel încât f = gq + r, grad r < grad g. Un polinom din K[X] cu coeficientul dominant egal cu 1 va fi numit polinom monic. Dacă K este un corp de numere vom nota cu Mn(K) (respectiv Mn(K[X])) mulţimea tuturor matricelor pătratice de ordin n cu coeficienţi din K (respectiv K[X]). Fie K un corp de numere şi A ∈ M n (K), A = (aij ) i , j =1,n . Dacă f ∈ K[X], f ( X ) = ad X d + ad −1 X d −1 +
+ K + a1 X + a0
,
atunci
matricea
d −1
f ( A) = ad A + ad −1 A + K + a1 A + a0 I n ∈ M n (K) se numeşte valoarea în A a polinomului f. Dacă f(A) = 0 spunem că A este rădăcină (din Mn(K)) a lui f. Evident, dacă a∈ K şi f, g∈ K[X], atunci valoarea în A a polinomului f + g (respectiv fg, af) este egală cu f(A) + g(A) (respectiv f(A)·g(A), af(A)). Se observă că orice matrice Γ = ( f ij )i , j =1,n din Mn(K[X]) poate fi d
reprezentată în mod unic ca un polinom în X cu coeficienţi în Mn(K), Γ = Ad X d + Ad −1 X d −1 + K + A1 X + A0 , unde Ai ∈ M n (K), i = 0, d iar d este egal cu cel mai mare din gradele polinoamelor f ij . 61
− X3 + X −3 2X 3 + 2X ∈ M 2 (Q[ X ]) se matricea Γ = 2 3 2 − 2 X + X + 1 3X + X + 5 − 1 2 3 0 0 2 1 2 − 3 0 X + X + X + . poate scrie sub forma Γ = 0 3 − 2 1 1 0 1 5 Fie K un corp de numere şi A = (aij ) ∈ M n (K). Matricea
Astfel,
a11 − X a12 K a1n a21 a22 − X K a2 n ∈ M n (K[x]) se numeşte matricea A − XI n = KK a n1 an 2 K ann − X carateristică a lui A iar polinomul p A ( X ) ∈ K[X], p A ( X ) = det( A − XI n ) se numeşte polinom caractersitic al lui A. Cum în dezvoltarea determinantului det( A − XI n ) apare şi termenul (a11 − X ) ⋅ (a22 − X ) ⋅ K ⋅ ⋅ (ann − X ) , iar ceilalţi termeni omit cel puţin două
elemente
de
pe
diagonala
principală
a
lui
A − XI n ,
rezultă
că
gard p A ( X ) = n şi termenii săi de grad n şi n – 1 provin din dezvoltarea produsului (a11 − X ) ⋅ (a22 − X ) ⋅ K ⋅ (ann − X ) = (−1) n X n − (a11 + a22 + K + ann ) X n−1 + K + a11 ⋅ a22 ⋅ K ⋅ ann . Aşadar, p A ( X ) are gradul n, coeficientul dominant egal cu 1 şi coeficientul lui X n−1 este egal cu –TrA, unde TrA = a11 + a22 + K + ann ∈ K. n
Numărul TrA = ∑ aii ∈ K, se numeşte urma matricei A = (aij ) ∈ M n (K) i =1
(TrA este suma elementelor de pe diagonala principală a lui A). Să observăm că şi termenul liber al polinomului p A ( X ) poate fi precizat. Cum termenul liber al unui polinom f(X) este egal cu f(0), în cazul lui p A ( X ) avem p A (0) = det A . Aşadar, p A ( X ) = (−1) n ( X n − σ 1 X n−1 + σ 2 X n−2 − K + (−1) n−1σ n−1 X + (−1) n σ n ) , unde σ k este suma tuturor minorilor diagonali de ordin k din matricea A (un minor diagonal este format cu linii şi coloane de aceeaşi indici).
62
Teorema lui Cayley-Hamilton
Vom demonstra în continuare următoarea: Lemă 2.3.4. Fie B0 , B1 , K , Bm ∈ M n (K) matrice fixate, şi funcţia f:K→ M n (K), f ( x) = B0 + + xB1 + K + x m Bm . Dacă f ( x) = On , ∀x ∈ K, atuci B0 = B1 = K = Bm = On . Demonstraţie: Efectuând înmulţirile cu scalari, apoi adunările, obţinem f(x) = B, unde matricea B ∈ M n (K) are ca elemente polinoame cu coeficienţi din corpul de numere K de grad cel mult n. Deoarece aceste polinoame sunt identic nule (conform ipotezei), rezultă că toţi coeficienţii acestora, adică toate elmentele matricelor Bk (k = 0, m) sunt nule, ceea ce demonstrează lema. Teoremă 2.3.5. (Cayley-Hamilton): Orice matrice pătratică din M n (K) este rădăcină a polinomului său caracteristic. Demonstraţie: Fie A ∈Mn (K), A = (aij ) i , j =1,n şi a11 − X p A ( X ) = det( A − XI n ) =
a21
a12 K a1n
a22 − X
K a2 n
KK an1 an 2 K ann − X
= (−1) n ( X n −
− σ 1 X n−1 + σ 2 X n−2 − K + (−1) n−1σ n−1 X + (−1) n σ n ) , polinomul caracteristic al matricei A, unde σ n = p A (0) = det A . p A ( A) = 0 . Putem scrie Vom arăta că ( A − XI n )( A − XI n )* = det( A − XI n ) I n (Dacă M ∈ M n (K), atunci avem M · M* = detM · In, unde M* este matricea reciprocă a lui M). Elementele matricei reciproce ( A − xI n ) * sunt polinoame cu coeficienţi din K de grad cel mult n – 1, deci putem scrie n −1 ( A − XI n )* = B0 + XB1 + K + X Bn−1 , unde B0 , B1 , K , Bn−1 ∈ M n (K) şi nu depind de X. În consecinţă, avem n −1 n n n −1 n−2 n −1 ( A − xI n )( B0 + xB1 + K + x Bn−1 ) = (−1) ( x − σ 1 x + σ 2 x − K + (−1) σ n−1 x + + (−1) n σ n ) I n , ∀x ∈ K. Efectuând înmulţirile şi ordonând convenabil, egalitatea de mai sus devine ( AB0 − σ n I n ) +
63
+ x( AB1 − B0 + σ n −1 I n ) + x 2 ( AB2 − B1 − σ n − 2 I n ) + K + + x n −1 ( ABn −1 − Bn − 2 + (−1) n −1σ 1 I n ) + x n (− Bn −1 − (−1) n I n ) = = On , ∀x ∈ K.
AB0 = σ n I n AB1 − B0 = −σ n−1 I n AB2 − B1 = σ n−2 I n . Conform lemei, de aici rezultă: KKK ABn−1 − Bn−2 = (−1) n−1σ 1 I n − Bn−1 = (−1) n I n
Înmulţind la stânga relaţiile precedente respectiv cu I n , A, A2 , K , An , apoi adunându-le obţinem On = (−1) n ( An − σ 1 An−1 + σ 2 An−2 − K + (−1) n σ n ) , ceea ce demonstrează teorema lui Cayley-Hamliton. Aplicaţii 2.3.6. Inversa unei matrice Fie A o matrice de ordinul n, inversabilă, atunci conform teoremei lui Cayley-Hamilton ea verifică ecuaţia sa caracteristică, deci: (1) An − σ 1 An−1 + σ 2 An−2 − K + (−1) n−1σ n−1 A + (−1) n σ n I n = On . Înmulţind ambii membri ai relaţiei (1) la dreapta cu A–1, rezultă An − σ 1 An−1 + σ 2 An−2 − K + (−1) n−1σ n−1 A + (−1) n σ n I n A−1 = On sau An−1 − σ 1 An−2 + σ 2 An−3 − K + (−1) n−1σ n−1 I n + (−1) n σ n A−1 = On , de căci A este inversabilă) rezultă unde ( σ n = det A ≠ 0 ,
[
]
(−1) n n−1 A − σ 1 An−2 + K + (−1) n−1σ n−1 I n . det A Procedeul este preferabil dacă ordinul n nu este prea mare. 3 1 1 Exemplu 2.3.7. Fie A = 2 0 2 . Într-adevăr, A este inversabilă deoarece 1 1 0 A−1 = −
det A = –2 ≠ 0.
64
[
]
1 A2 − σ 1 A + σ 2 I 3 , unde det A = –2, det A a a σ 1 = Tr ( A) = 3 + 0 + 0 = 3 , σ 2 = 11 12 + a21 a22 Avem: A−1 =
+
a11 a31
a13 a22 + a33 a32
a23 3 1 3 1 0 2 = + + = −2 − 1 − 2 = −5 şi a33 2 0 1 0 1 0
12 4 5 1 A = 8 4 2 iar I 3 = 0 5 1 3 0 Avem 12 4 5 3 1 −1 A = − 8 4 2 − 3 2 2 5 1 3 1 2
0 0 1 0 . 0 1
1 1 1 0 0 2 − 2 1 1 0 2 − 5 0 1 0 = − 2 − 1 − 4 . 2 1 0 0 0 1 2 − 2 − 2
2.3.8. Calculul puterilor unei matrice prin recurenţă Folosind teorema lui Cayley-Hamilton, putem calcula A p , ∀A ∈ M n (C) şi ∀p ∈ N*, prin recurenţă.
Într-adevăr, cum An + α1 An−1 + K + α n I n = 0 , înmulţind cu Ak, obţinem An+k + α1 An+ k −1 + K + + α n Ak = 0, k ∈ N. Deci, trebuie calculate primele puteri, după care se deduc celelalte recursiv. În particular, pentru orice k, Ak se exprimă ca polinom de grad ≤ n − 1 de matrice A. Puterile matricelor de ordinul trei
Fie A ∈ M 3 (C), A = (aij ) i , j =1, 2,3 . După cum ştim ecuaţia carateristică a matricei A se poate scrie sub forma a11 − λ a12 a13 a21 a22 − λ a23 = 0 sau (1) λ3 − σ 1λ2 + σ 2 λ − σ 3 = 0 , unde a31 a32 a33 − λ
65
σ 1 = Tr ( A) = a11 + a22 + a33 (urma matricei A), σ2 =
a11
a12
a21
a22
+
a11 a31
a13 a22 + a33 a32
a23 , iar σ 3 = det A , determinantul matricei A. a33
Ţinând seama de teorema lui Cayley-Hamilton, se obţine relaţia: A − σ 1 A2 + σ 2 A − σ 3 I 3 = O3 . 3
Proprietate 2.3.9. Dacă A ∈ M 3 (C), atunci An = xn A2 + yn A + z n I 3 , ∀n ∈ N*. Demonstraţie: Pentru n = 1 proprietatea este adevărată (x1= 0, y1= 1, z1= 0). Pentru n = 2 proprietatea este de asemenea adevărată (x2= 1, y2= 0, z2= 0). Pentru n = 3, ţinând seama de ecuaţia caracteristică, avem x3 = σ 1 , y3 = −σ 2 , z3 = σ 3 .
Presupunem că Ak = xk A2 + yk A + z k I 3 este adevărată pentru k ≥ 3 . Atunci avem 2 = ( xk A + yk A + z k I 3 ) A = ( x3 xk + yk ) A2 + ( y3 xk + z k ) A + z3 xk I 3 .
Ak +1 = Ak A =
xk +1 = x3 xk + yk Notând (2) yk +1 = y3 xk + z k , obţinem Ak +1 = xk +1 A2 + yk +1 A + z k +1 I 3 , deci z = z x 3 k k +1
proprietatea este adevărată ∀n ∈ N*. Din (2) rezultă relaţia de recurenţă xn+1 = x3 xn + y3 xn−1 + z3 xn−1 , n ≥ 3 , căreia i se asociază ecuaţia caracteristică (3) r 3 = x3 r 2 + y3 r + z3 care este totuna cu ecuaţia caracteristică (1). Dacă ecuaţia caracteristică (3) are rădăcinile r1, r2, r3 reale distincte atunci xn = c1r1n + c2 r2n + c3 r3n . Dacă r1 = r2 ∈ R şi r1 ≠ r2 ∈ R, atunci xn = (c1 + c2 n)r1n + c3 r3n . Dacă r1 ∈ R iar r2 , r3 ∈ C–R, fie r3 = ρ (cos t + i sin t ) ,
atunci
xn = c1r1n + ρ n (c2 cos nt + c3 sin nt ) . Din (2) rezultă imediat yn şi zn, după care se poate calcula An. 1 1 0 Exemplu 2.3.10.: Fie A = 0 1 1 . Să se calculeze An , n ∈ N*. 0 0 1 Aplicând propoziţia de mai sus, rezultă σ 1 = 3, σ 2 = 3, σ 3 = 1 iar ecuaţia caracteristică
a
matricei
A
devine 66
A3 = 3 A 2 − 3 A + I 3 ,
de
unde
x3 = 3, y3 = −3, z3 = 1 . Ecuaţia caracteristică (3) devine r 3 = 3r 2 − 3r + 1 de unde r1 = r2 = r3 = 1 . Ţinând cont că x1 = 0, x2 = 1, x3 = 3 , obţinem xn =
n2 − n . Din 2
(n − 1)(n − 2) , yn = − n(n − 2) . Deci 2 (n − 1)(n − 2) n2 − n 2 An = xn A2 + yn A + z n I 3 , adică An = A − n(n − 2) A + + I3 , 2 2 n(n − 1) 1 n 2 n , n ∈ N*, rezultat ce se putea obţine de unde se obţine An = 0 1 0 0 1 2 3 uşor calculând A , A până se observa regula de obţinere a matricei A, rezultat ce se verifică prin inducţie matematică sau aplicând binomul lui Newton, 0 1 0 obsevând că A = I 3 + B , unde B = 0 0 1 . 0 0 0 z n = z3 xn−1 , yn = y3 xn−1 + z n−1 se obţine z n =
2.3.11. Polinom minimal al unei matrice
Fie K un corp de numere şi A ∈ M n (K). Există polinoame diferite de 0 din K[X] care admit pe A ca rădăcină, de exemplu pA. Proprietate 2.3.12. Fie f un polinom de grad minim printre polinoamele diferite de 0 din K[X] care admit pe A ca rădăcină. Pentru orice g ∈ K[X] care admite pe A ca rădăcină există q ∈ K[X] astfel încât g = f · q, adică f divide în K[X] pe g. Demonstraţie: Fie q, r ∈ K[X] astfel încât g = f · q + r, grad r < grad f. Luând valoarea în A a polinoamelor din egalitatea precedentă, obţinem r(A) = 0. Dacă r ≠ 0 se constrazice alegerea lui f. Aşadar, r = 0, deci g = f · q. Fie f = ad X d + ad −1 X d −1 + K + a1 X + a0 , ad ≠ 0 , polinomul din enunţul
propoziţiei de mai sus. Polinomul ad−1 f admite de asemenea pe A ca rădăcină, este monic şi are gradul tot d.
67
Dacă f1 şi f 2 sunt două polinoame monice de grad d din K[X] care admite pe A ca rădăcină, atunci f1 = f 2 . Într-adevăr, conform propoziţiei demonstrate f1 şi f 2 se divid reciproc în K[X] şi fiind monice se deduce imediat că f1 = f 2 . Definiţie 2.3.13. Fie K un corp de numere şi A ∈ M n (K). Polinomul monic mA de grad minim din K[X] care admite pe A ca rădăcină se numeşte polinomul minimal al lui A. 0 −1 0 Exemplu 2.3.14. Fie A ∈ M 3 (R), A = − 1 0 0 . 0 0 1 Polinomul
carasteristic al lui A este 0 − X −1 p A ( X ) = det( A − XI 3 ) = − 1 − X 0 = −( X − 1) 2 ( X + 1) . Divizorii lui 0 0 1− X p A ( X ) sunt 1, X – 1, X +1, (X – 1)2, (X – 1)(X + 1) = X2 – 1, şi (X – 1)2(X + 1). Polinomul mA(X) va fi polinomul de grad minim din lista de mai sus ai divizorilor lui p A ( X ) .
Cum A2 = I 2 rezultă că X2 – 1 admite pe A ca rădăcină şi cum 1, X – 1 şi X + 1 nu admit pe A ca rădăcină, deducem că m A ( X ) = X 2 − 1 . Din ultima propoziţie şi teorema lui Cayley-Hamilton, deducem următorul: Corolar 2.3.15. Fie K un corp de numere şi A ∈ M n (K). Atunci mA divide în K[X] pe pA, adică polinomul minimal este divizor al polinomului caracteristic. Dacă dA = grad (mA), atunci d A ≤ n . 2.3.16. Polinomul minimal al unui număr algebric
Fie K un corp de numere f ∈ K[X] un polinom de grad d, d > 0. Spunem că f este reductibil peste K, dacă există g , h ∈ K[X] astfel încât f = g · h, grad(g) < d şi grad(h) < d. În caz contrar, spunem că f este polinom inductibil peste K. Polinoamele inductibile peste C sunt cele de gradul 1, iar peste R cele de gradul 1 şi cele de gradul 2 fără rădăcini reale. Fie K un corp de numere şi z ∈ C. Spunem că z este algebric peste K, dacă există g ∈ K[X], g ≠ 0, astfel încât g(z) = 0. În caz contrar, spunem că z este transcendent peste K. 68
Numărul 3 2 este algebric peste Q deoarece g (3 2 ) = 0 , unde g = X 2 − 2 ∈ Q. Dacă z ∈ C, z = a + bi, cu a, b ∈ R, atunci g(z) = 0, unde
g = X 2 − 2aX + a 2 + b 2 ∈ R[X], deci orice număr complex este algebric peste R. Numerele reale π şi e (baza logaritmilor naturali) sunt transcendente peste Q. Fie z ∈ C un număr algebric peste corpul de numere K. Polinomul monic f de grad minim din K[X] care admite pe z ca rădăcină se numeşte polinomul minimal al lui z peste K. Ca şi în cazul matricelor, se arată că f este unic determinat şi că divide în K[X] orice polinom g ∈ K[X] cu proprietatea g(z) = 0. Proprietate 2.3.17. Fie K un corp de numere şi z ∈ C, z algebric peste K. Atunci polinomul minimal f al lui z peste K este ireductibil peste K. Demonstraţie: Fie n = grad(f). Evident n > 0. Dacă f este reductibil peste K, atunci există g , h ∈ K[X] astfel încât f = g ⋅ h , grad(g) < n şi grad(h) < n. Luând valoarea în z a polinoamelor din ultima egalitate se obţine g ( z )h( z ) = f ( z ) = 0 , de unde g(z) = 0 sau h(z) = 0, ceea ce contrazice definiţia polinomului minimal. Rămâne adevărat că f este ireductibil peste K. Observaţie 2.3.18. Polinomul minimal al unei matrice nu este obligatoriu ireductibil după cum rezultă din exemplul dat anterior. Ireductibilitatea polinomului minimal al unui număr algebric s-a stabilit folosind faptul că produsul a două numere complexe diferite de zero este diferit de zero, proprietate care nu mai este adevărată în cazul matricelor. Observaţie 2.3.19. Fie f ∈ K[X] un polinom ireductibil peste K şi z ∈ C o rădăcină a lui f. Atunci polinomul minimal al lui z peste K este chiar f. În adevăr, cum f(z) = 0, polinomul minimal al lui z divide pe f şi cum singurul divizor monic de grad pozitiv al lui f este f, se obţine rezultatul menţionat. 2.4. Teorema lui Frobenius Teoremă 2.4.1. (Frobenius). Fie K un corp de numere şi A ∈ M n (K). Polinoamele pA şi mA admit aceeaşi divizori ireductibili peste K. Demonstraţie: Cum mA divide pe pA (conform corolarului) este clar că orice divizor ireductibil al lui mA este şi al lui pA. Rămâne să arătăm că dacă f este un divizor ireductibil peste K al lui pA, atunci f este divizor şi al lui mA. Evident, putem presupune că f este monic. Fie α ∈ K o rădăcină a lui f. Conform observaţiei 2.4.19., polinomul minimal al lui α este f. Dacă mA( α ) = 0, atunci f divide pe
69
mA şi demonstraţia este încheiată. Trebuie să excludem cazul mA( α ) ≠ 0. Dacă mA( α ) ≠ 0, atunci cel mai mare divizor comun în K[X] al lui mA(X) şi X – α este egal cu 1. Conform unei proprietăţi cunoscute a celui mai mare divizor comun, există g,h ∈ K[X] astfel încât m A ( X ) g ( X ) + ( X − α )h( X ) = 1 . Luând valoarea în A a polinoamelor din egalitatea precedentă se obţine ( A − αI n )h( A) = I n , de unde 1 = det( I n ) = det( A − αI n ) det(h( A)) = (−1) n p A (α ) det(h( A)) . Cum f divide pe p A şi f (α ) = 0 , p A (α ) = 0 , de unde 1 = 0, contradicţie. Rămâne adevărat că m A (α ) = 0 , deci f divide pe mA. Observaţie 2.4.2. Un alt argument care permite demonstraţia teoremei se bazează pe problema p(A) = 0 rezultă p(λ ) = 0, ∀λ valoare proprie. Avem mA(A) = 0 rezultă m A (λ ) = 0 pentru orice valoare proprie a matricei A, deci mA şi fA au aceleaşi rădăcini, diferă eventual doar ordinul de multiplicitate. Deoarece λ este algebric peste K (rădăcina a lui f A ∈ K[X]), λ admite un polinom minimal (de gradul minim g λ ∈ K[X] pentru care g λ (λ ) = 0 , atunci g λ este factor în mA şi evident fA.
70
2.5. Probleme rezolvate (2.2) R2.3.1. Să se determine valorile proprii şi vectorii proprii ai matricei: 0 1 K 0 0 0 0 K 0 0 . C = KKK 0 0 K 0 1 1 0 K 0 0 Soluţie: x2 = λx1 x2 = λx1 x = λx 3 2 x = λ2 x 1 3 x = λx3 Sistemul CX = λX , X ≠ On,1 se scrie 4 sau . M M n − 1 x = λ x 1 n xn = λxn−1 x1 = λn x1 x1 = λxn Din ultima relaţie rezultă x1 = 0 sau λn = 1 . Dacă x1 = 0 din celelalte relaţii rezultă X = On ,1 , fals. Deci λn = 1 şi obţinem valorile proprii λk = ε k = 0, n − 1 şi 1 εk 2kπ 2kπ + i sin , rădăcinile vectorii proprii X k = ε k2 , k = 0, n − 1 ε k = cos n n M ε p −1 k de ordin n ale unităţii).
R2.3.2. Să se descompună într-un produs de factori, polinomul caracteristic al a 2 ab ab b 2 ab a 2 b 2 ab matricei A = . Să se deducă valorile proprii ale matricei A şi 2 2 ab b a ab b 2 ab ab a 2 valoarea lui detA.
71
Soluţie: Polinomul caracteristica se scrie: a2 − λ ab ab b2 ab a2 − λ b2 ab . p A (λ ) = ab b2 a2 − λ ab b2 ab ab a2 − λ Se adună la elementele primei coloane, elementele celorlalte coloane, ceea ( a + b) 2 − λ . Rezultă: ce permite a scoate în factor
[
]
p A (λ ) = ( a + b) 2 − λ ⋅
[
]
a 2 − ab − λ
b 2 − ab
b 2 − ab 0
a 2 − ab − λ 0
ab − b 2
[
]
ab − b 2 = (a + b) 2 − λ ⋅ a2 − b2 − λ
⋅ (a − b) 2 − λ ⋅ (a 2 − b 2 − λ ) 2 . Valorile proprii sunt λ1 = (a + b) 2 , λ2 = (a − b) 2 , λ3 = λ4 = a 2 − b 2 . Determinantul lui A se obţine făcând λ = 0 în polinomul caracteristic, aşadar det A = (a 2 − b 2 ) 2 . R2.3.3. Fie A, B ∈ M n (C). Să se arate că polinomul caracteristic al matricei A − B , este egal cu produsul polinoamelor caracteristice ale matricelor A + B A iB şi A – iB. Soluţie: Avem A − λI n −B ( A − iB ) − λI n − B − iA + λiI n = = det( M − λI 2 n ) = B A − λI n B A − λI n =
( A − iB ) − λI n B
0 = det(( A − iB ) − λI n ) det(( A + iB ) − λI n ) . ( A + iB ) − λI n
R2.3.4. Să se arate că dacă A ∈ M n (R) este o matrice antisimetrică şi reală, atunci det A ≥ 0 . Soluţie: Dacă λ1 , λ2 , K , λn sunt valorile proprii ale matricei A, atunci det A = λ1 ⋅ λ2 ⋅ K ⋅ λn . Cum A este antisimetrică şi reală, atunci ea este antihermetiană, deci valorile proprii sunt de forma i ⋅ b, b ∈ R. Evident, dacă o
72
valoare proprie este reală, ea este λ = 0 şi det A = 0 (în particular, o matrice antisimetrică şi reală, de ordin impar are determinantul zero). Dacă nu, polinomul caracteristic fiind cu coeficienţi reali, are rădăcinile complexe conjugate, deci rădăcinile se cuplează în perechi de forma λ1 = ib1 , λ2 = −ib1 , K , λ2 k −1 = ibk , λ2 k = −ibk cu produsul
λ1 ⋅ λ2 ⋅ K ⋅ λ2 k = b12 ⋅ b22 ⋅ K ⋅ bk2 > 0 . R2.3.5. Fie A ∈ M n (R) o matrice reală şi λ = a + ib ∈ C, a ∈ R, b ∈ R* o valoare proprie nereală iar Z = X + iY ≠ On,1 un vector propriu corespunzător cu X, Y ∈ M n ,1 (R). Să se arate că: a). X ≠ On ,1 , Y ≠ On ,1 ; b). Dacă αX + βY = On ,1 , α , β ∈ R rezultă α = β = 0 ; c). Dacă f ∈ R[X] este un polinom şi f (λ ) ∈ R, atunci X şi Y sunt vectori proprii pentru matricea f(A). Soluţie: AX = aX − bY (1) . Avem A(X +iY) = (a + ib)(X + iY) şi rezultă S : AY = aY + bX (2) a). Dacă Y = On ,1 , din relaţia a doua rezultă bX = On,1 (b ≠ 0), deci
X = On ,1 şi obţinem Z = On,1 (constradicţie), deci Y ≠ On ,1 . Dacă X = On ,1 , din prima relaţie rezultă –bY = On,1 , contradicţie. Deci X ≠ On ,1 şi Y ≠ On ,1 ; b).
Avem:
AX = aX − bY ⋅ α , AY = aY − bX ⋅ β
de
unde
obţinem
βX − αY = On ,1 ⋅ β A(αX + βY ) = a(αX + βY ) + b( βX − αY ) sau , de unde α X β Y O α + = ⋅ n , 1 2 2 2 2 rezultă (α + β ) X = On ,1 , sau α + β = 0 , adică α = β = 0 . c). Avem f ( A) Z = f (λ ) Z sau f ( A)( X + iY ) = f (λ )( X + iY ) , de unde obţinem f ( A) X = f (λ ) X şi f ( A)Y = f (λ )Y . R2.3.6. Dacă A ∈ M n (C) şi P∈ C[X] astfel încât p(A) = 0, atunci pentru orice valoare proprie λ a matricei A avem p (λ ) = 0 (valorile proprii sunt rădăcini ale oricărui polinom care anulează matricea A). 73
Soluţie: Fie λ valoare proprie şi X vector propriu corespunzător pentru matricea A. Avem AX = λ X, X ≠ On ,1 şi p( A) X = p(λ ) X , X ≠ On ,1 , de unde
p (λ ) X = 0, X ≠ On ,1 , deci p (λ ) = 0 .
Probleme rezolvate (2.4)
R2.6.1. Fie A ∈ M n (C). Dacă An ≠ On , atunci Ak ≠ On , ∀k ∈ N. Soluţie: Conform teoremei lui Cayley-Hamilton, putem scrie: a1 I n + a2 A + a3 A2 + K + an An−1 + An = 0 .
(1)
Presupunem prim absurd că există k > n astfel încât Ak = On şi alegem k minim cu această proprietate, deci Ak −1 ≠ On . În (1) înmulţim cu Ak −1 şi rezultă
a1 Ak −1 + a2 Ak + a3 Ak +1 + K + an Ak +n−2 + Ak +n−1 = 0
şi
din
Ak = Ak +1 = K = Ak +n−1 = On , rezultă a1 Ak −1 = 0 , iar din Ak −1 ≠ On obţinem a1 = 0 . În (1) înmulţim cu Ak −2 şi obţinem a2 Ak −1 = 0 , deci a2 = 0 şi continuând procedeul, obţinem a1 = a2 = K = an = 0 , atunci din (1) rezultă An = 0 , contradicţie.
( )
R2.6.2. Fie Ak = aij( k )
i , j =1,n
.
a). Dacă a11( k ) = 0, ∀k = 1, n , atunci det A = 0; b). Dacă a12( k ) = 0, ∀k = 1, n − 1 , atunci a12( k ) = 0, ∀k ∈ N. Soluţie: Conform teoremei lui Cayley-Hamilton putem scrie: (2) n A − σ 1 An−1 + σ 2 An−2 − K + (−1) n−1σ n−1 A + + (−1) n σ n I n = On , de unde se obţin
n 2 egalităţi numerice. a). Urmărind egalitatea de pe poziţia (1,1), obţinem: ( n) ( n −1) ( n−2 ) n −1 (1) n a11 − σ 1a11 + σ 2 a11 − K + (−1) a11 σ n−1 + + (−1) σ n ⋅ 1 = 0 şi din ipoteză rezultă σ n = 0 , adică det A = 0; b). Urmărind egalitatea de pe poziţia (1,2), obţinem: ( n) ( n −1) ( n−2 ) n −1 (1) n a12 − σ 1a12 + σ 2 a12 − K + (−1) a12 σ n−1 + + (−1) σ n ⋅ 0 = 0 , deci a1(nn ) = 0 . 74
Apoi, înmulţind relaţia (2) cu A şi urmărim egalitatea de pe poziţia (1,2), obţinem, a12( n+1) − σ 1a12( n ) + σ 2 a12( n−1) − K + (−1) n−1 a12( 2)σ n−1 + (−1) n a12(1)σ n = 0 , deci
a12( n+1) = 0 şi prin inducţie se arată că a12( n+k ) = 0 , pentru orice k ∈ N. R2.6.3. Fie A ∈ M n . Dacă TrA > n , atunci Ak ≠ A p , ∀k , p ∈ N, k ≠ p. Soluţie: Dacă prin absurd ar exista k , p ∈ N cu Ak = A p , fie λ valoarea proprie pentru A. Din AX = λX , X ≠ On ,1 , rezultă Ak X = λk X , A p X = λ p X , deci k
λk = λ p . Avem λ = λ
p
deci λ ∈ {0,1} .
Atunci TrA = λ1 + λ2 + K + λn ≤ λ1 + λ2 + K + λn ≤ n , contradicţie. R2.6.4. Fie A ∈ M n . Dacă TrA = TrA 2 = K = TrA n = 0 , atunci An = On . Soluţie: Dacă λ1 , λ2 , K , λn sunt valorile proprii ale matricei A, atunci λ1k , λk2 , K , λkn sunt valorile proprii ale matricei λ1 + λ2 + K + λn = 0 λ2 + λ2 + K + λ2 = 0 1 2 n . K λ1n + λn2 + K + λnn = 0
Ak . Se obţine sistemul de ecuaţii
Vom arăta că singura soluţie este λ1 = λ2 = K = λn = 0 .
λ1 ⋅ 1 + λ2 ⋅ 1 + K + λn ⋅ 1 = 0 λ ⋅ λ + λ ⋅ λ + K + λ ⋅ λ = 0 2 2 n n 1 1 Dacă scriem sistemul sub forma λ1 ⋅ λ12 + λ2 ⋅ λ22 + K + λn ⋅ λ2n = 0 K λ1 ⋅ λ1n−1 + λ2 ⋅ λn2−1 + K + λn ⋅ λnn−1 = 0
rezultă că ( λ1 , λ2 , K , λn ) este soluţie a unui sistem de ecuaţii liniare cu determinantul sistemului, de tip Vandermonde ∆ = V(λ1 , λ2 , K , λn ) . Dacă ∆ ≠ 0 , atunci λ1 = λ2 = K = λn = 0 (concluzia dorită). Dacă presupunem ∆ = 0 , atunci λ1 , λ2 , K , λn nu sunt distincte. Să presupunem că λ1 , λ2 , K , λn sunt distincte cu multiplicităţile k1 , k 2 ,K, k p
75
( k1 + k 2 + K + k p = n ).
Reţinem
din
sistem
p
primele
(k1λ1 ) ⋅ 1 + (k 2 λ2 ) ⋅ 1 + K + (k p λ p ) ⋅ 1 = 0 (k λ ) ⋅ λ + (k λ ) ⋅ λ + K + (k λ ) ⋅ λ = 0 1 1 1 p p p 2 2 2 . K (k1λ1 ) ⋅ λ1p −1 + (k 2 λ2 ) ⋅ λ2p −1 + K + (k p λ p ) ⋅ λnp−1 = 0 Sistemul cu determinantul nenul V(λ1 , λ2 , K , λ p ) ≠ 0
( k1λ1 , k 2 λ2 , K , k p λ p )
care
trebuie
să
fie
soluţia
ecuaţii:
şi
banală,
soluţia deci
λ1 = λ2 = K = λ p = 0 . Dacă toate valorile proprii ale matricei A sunt egale cu 0, polinomul caracteristic este f A ( X ) = (− X ) n şi din teorema lui Cayley-Hamilton, rezultă (− A) n = 0 , adică An = On . 0 1 1 R2.6.5. Fie A = 1 0 1 . Să se determine un polinom de grad minim care 1 1 0 are pe A ca rădăcină. Soluţie: Cum A este rădăcină a polinomului său caracteristic 0 X −1 = X 3 − X 2 − 2X . Deci p A ( X ) = det( XI n − A) = − 1 X − 1 − 1 = 0
−1
X
A − A − 2 A = O3 (1). Polinomul minimal căutat este divizor al polinomului 3 2 X − X − 2 X = X ( X − 2)( X + 1) . Deci polinomul minimal este unul dintre polinoamele X, X – 2, X + 1, X(X – 2), X(X + 1), (X – 2)(X + 1), X(X – – 2)(X +1). Obsevăm că A nu verifică nici una din relaţiile A = O3 , A − 2 I 3 = O3 , A + I 3 = O3 , A( A − 2 I 3 ) = O3 , ( A − 2 I 3 )( A + I 3 ) = O3 , şi deci polinomil minimal este X(X – 2)(X +1), adică ( A − 2 I 3 )( A + I 3 ) = O3 . 3
2
R2.6.6. Fie A ∈ M n (R) astfel încât A3 = A + I 3 . Atunci det A > 0.
76
Soluţie: Din ipoteză rezultă că m A divide polinomul X 3 − X − 1 . Folosind eventual mijloacele analizei matematice, se arată că X 3 − X − 1 are o singură rădăcină reală a şi aceasta este strict pozitivă. Deci X 3 − X − 1 = ( X − a)( X 2 + bX + c) cu a, b, c ∈ R, a > 0 şi b 2 − 4c < 0 . Evident, c > 0. Cum m A divide pe X 3 − X − 1 , rezultă că divizorii inductibili peste R ai lui m A , deci şi ai lui p A , sunt din mulţimea {X – a,
X 2 + bX + c }. Descompunând pe p A în produs de factori inductibili peste R, avem X n − (a11 + K + ann ) X n−1 + K + + (−1) n det A = p A ( X ) = ( X − a ) s ( X 2 + bX + c) t , cu s, t ∈ N, s + 2t = n. Luând valoarea în 0 a polinomului din egalitatea precedentă, obţinem n (−1) det A = (−1) s a s c t = = (−1) n−2t a s c t = (−1) n a s c t , de unde s t det( A) = a c > 0 . R2.6.7. Fie A ∈ M 2 (Z) cu proprietatea că există n ∈ N*, (n,6) = 1, astfel încât
An = I 2 , atunci A = I 2 . Soluţie: Avem A ∈ M 2 (Z) ⊆ M 2 (R) şi fie m A polinomul minimal în R[X] al lui A. Dacă d A = 1 , atunci m A = X − α cu α ∈ R. Cum X − α = m A este divizor al lui X n − 1 şi cum acest din urmă polinom are în cazul (n,2) = 1 ca singură rădăcină reală α = 1 , rezultă că m A = X – 1, deci A = I 2 . Dacă d A = 2 , atunci m A = p A = X 2 + pX + q ∈ Z[x]. Când (n,2) = 1, X n − 1 are o singură rădăcină reală, anume pe 1, şi aceasta este simplă. Cum m A divede pe X n − 1 , avem ∆ = p 2 − 4q < 0 , deci 2kπ m A = X 2 − 2 cos X + 1,0 < k < n . Dar m A = p A ∈ Z[X], de unde rezultă că n 2kπ 2kπ ∈ 0,1,−1, 1 ,− 1 . Cum ∆ < 0 , rezultă că cos cos = 0 sau 2 2 n n 2kπ 2kπ cos = ± 1 2 . Însă din (n,2) = 1 rezultă că cos ≠ 0 , iar din (n,3) = 1 n n 2kπ rezultă că cos ≠ ± 1 2 . Deci cazul d A = 2 nu este posibil. n
{
}
77
3. Transformari elementare in matrice 3.1 Transformări elementare Definiţie 3.1.1. Prin transformări elementare înţelegem următoarele operaţii (efectuate asupra unei matrice). a) înmulţirea unei linii (coloane) cu un număr nenul; b) schimbarea a două linii (coloane) între ele; c) adunarea la elementele unei linii (coloane) a elementelor altei linii (coloane) înmulţite cu acelaşi număr nenul. Definiţie 3.1.2. Fiind dată o matrice EMBED Equation.3 , vom înţelege că matricea EMBED Equation.3 este echivalentă cu A şi scriem A ≈ B , deci B se obţine din A prin efectuarea unui număr finit de transformări elementare. Definiţie 3.1.3. Prin matrice elementară de linii, înţelegem matricea obţinută din matricea unitate I m prin efectuarea transformărilor corespunzătoare. Prin matrice elementară de coloane, înţelegem matricea obţinută din matricea unitate I n prin efectuarea transformărilor corespunzătoare. Exemplu 3.1.4. (matrice elementară de linii) 1 0 L L L 0 0 0 1 L L L 0 0 L L L L L L L ∈ M m (C) , α ≠ 0 . L1i i 0 0 L α L 0 0 L L L L L L L 0 0 L 0 L 0 1 i 1 0 L L 0 L L L L L i L L 0 1 L L2 i , j L L L L L ∈ M m (C) j L L 1 0 L L L L L L 0 0 L L 1 i j
78
L3 i ,i + j
Teoremă
1 0 L L 0 1 L L L L L i 0 0 L 1 L L L j 0 0 L 1 0 0 L 0 i 3.1.5. Efectuarea în
L L 0 L L 0 L L 0 L 0 ∈ M m (C) L L 1 O 0 L 1 j matricea A ∈ M m ,n (C) a unei transformări
elementare pe linii, revine la înmulţirea matricei A la stânga cu matricea elementară de linii corespunzătoare transformării. Efectuarea în matricea A ∈ M m ,n (C) a unei transformări elementare pe coloane, revine la înmulţirea la dreapta a matricei A cu matricea elementară de coloane corespunzătoare transformării. Demonstraţie: Fie A ∈ M m ,n (C) , A = (aij )i =1,m . Să presupunem că în matricea A j =1, n
vrem să facem următoarea transformare elementară: schimbarea liniilor i şi j între ele (1 ≤ i < j ≤ m ) . Atunci, vom înmulţi matricea A la stânga cu matricea elementelor de linii, ce se obţine din I m , schimbând liniile i şi j între ele. Obţinem astfel transformarea dorită. Analog se demonstrează pentru celelalte cazuri.
3.2. Calculul rangului unei matrice prin transformări elementare Definiţie 3.2.1. Matricea A = (aij )i =1,m se numeşte matrice diagonală dacă aij = 0 , (∀)i ≠ j , adică are forma: a11 0 A= 0 0
j =1, n
L L L L L L 0 a 22 L L L L L L 0 0 O L L a rr L L L L 0 0 0 O 0 L 0 L L L L 0 0
79
Teoremă 3.2.2. Orice matrice nenulă A ∈ M m ,n (C) , A = (aij )i =1,m se poate j =1, n
aduce, prin transformări elementare, la forma diagonală. Demonstraţie: Deoarece A ≠ Om,n , rezultă că există un număr aij ≠ 0 . Dacă a11 = 0 , atunci aplicând transformări elementare aducem pe aij în locul lui a11
(permutăm prima linie cu linia i şi apoi prima coloană cu coloana j) şi obţinem o matrice echivalentă cu A. Deci, putem presupune că a11 ≠ 0 . Folosind transformări elementare (scăzând din fiecare linie j ≠ 1 prima linie înmulţită cu a11−1 a ji , apoi din fiecare
coloană obţinută prima coloană înmulţită cu a11−1a1k , k ≠ 1 ) obţinem o matrice echivalentă cu cea iniţială având toate elementele de pe prima linie egale cu zero, mai puţin primul element. Deci, obţinem o matrice A'∈ M m,n (C) echivalentă cu A şi având următoarea formă: a11' 0 L L 0 ' ' L a 2' n 0 a 22 a 23 A' = L L L L L ' 0 a' L L a mn m2 În continuare reluăm raţionamentul cu matricea: ' ' a 22 a 23 L a 2' n ' ' L a3' n a32 a33 B= care este o matrice de tip (m − 1, n − 1) . L L L L ' ' a' a L a m3 mn m2
După un număr finit de paşi obţinem o matrice diagonală D ∈ M m,n (C) de forma 1 0 L L L L 0 L 0 1 L L L L 0 L L L L L L L L L D=0 0 L 1 L L 0 L 0 0 L L 0 L L L L L L L L L L L 0 0 L L L L L L Operaţia de a aduce o matrice A ∈ M m ,n (C) numeşte diagonalizarea matricei A. 80
0 M M M , echivalentă cu matricea A. 0 M 0 la forma diagonală de mai sus, se
Exemplu 3.2.3. Să se aducă la forma diagonală, folosind transformările elementare, matricea: 1 −1 2 2 0 −1 2 3 1 4 A= 3 2 1 1 − 1 − 12 5 − 8 − 5 1 Soluţie: 1 −1 2 2 1 0 −1 2 2 0 4 −1 2 3 1 −1 4 2 3 1 A= ≈ ≈ 3 2 1 1 −1 2 3 1 1 −1 −12 5 −8 −5 1 5 −12 −8 −5 1 0 0 0 1 0 0 0 0 1 0 0 4 1 5 3 0 1 4 5 3 ≈ ≈ ≈ 0 3 −3 −5 3 −3 −5 0 3 3 0 −12 −3 −15 −9 0 −3 −12 −15 −9 0 0 1 0 0 0 0 1 0 0 0 1 0 0 0 0 1 0 0 0 ≈ ≈ . 0 0 −9 −18 −14 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0
Propoziţia precedentă ne ajută să calculăm rangul unei matrice reducând matricea iniţială, prin transformări elementare, la o matrice diagonală. Conform teoremei demonstrate mai sus, rezultă că: Fiind dată o matrice A ∈ M m ,n (C) , există o matrice diagonală de forma 1 0 L L L L 0 0 1 L L L L 0 L L L L L L L D=0 0 L 1 L L 0 0 0 L L 0 L L L L L L L L L 0 0 L L L L L unde primele r elemente de pe diagonala principală încât D ≈ A . În acest caz rang A = rang D = r . 81
L L L L L L L sunt
0 M M M , 0 M 0 1 iar restul 0 şi astfel
Proprietate 3.2.4. Fie A, B ∈ M m,n (C) . Dacă A ≈ B , atunci rang A = rang B . Demonstraţie: Rezultă imediat din faptul că rangul unei matrice nu se schimbă dacă permutăm două linii (sau coloane) sau dacă la o linie (coloană) adunăm o altă linie (coloană) înmulţită cu un element nenul din C. a) Într-adevăr, să presupunem că am schimbat două linii (coloane) între ele. Dacă ambele linii intră în minorul matricei A, determinanţii celor două matrice au valori opuse. Dacă ambele linii nu intră în componenţa minorului lui A, nu vor intra nici în componenţa minorului lui B. Deci, determinantul minor ce dă rangul matricei A, rămâne egal cu determinantul ce dă rangul matricei B. Cazul în care o singură linie intră în minorul matricei A se reduce la precedentele. b) Să presupunem că matricea B se obţine din matricea A prin înmulţirea unei linii (coloane) din matricea A cu un număr α ≠ 0 . Dacă linia aparţine minorului nenul ∆ din A, avem în noua matrice minorul corespunzător k∆ . Deci, rangul se păstrează. c) Să presupunem că matricea B se obţine din matricea A prin adunarea elementelor liniei i din A înmulţite cu α1 ≠ 0 cu elemntele liniei j, înmulţite cu α2 ≠ 0 . Într-adevăr, dacă liniile i şi j ale matricei A nu aparţin minorului A ce dă rangul matricei, proprietatea este evidentă. Dacă liniile i şi j aparţin minorului lui A ce dă rangul, atunci minorul corespunzător din B se va descompune în suma a doi determinanţi, dintre care unul va fi nul. Dacă una din linii, de exemplu i, aparţine minorului matricei A, bordăm acest minor, de ordinul r, cu o coloană oarecare din A şi cu linia j, din A conform definiţiei rangului, determinantul ultim este nul, dar un determinant de ordinul r + 1 , obţinut prin condiţiile de mai sus se va descompune în suma a doi determinanţi de ordinul r + 1 , care aparţin matricei A şi deci sunt nuli. Prin urmare, pentru a găsi rangul unei matrice A, aducem această matrice prin transformări elementare la forma diagonală, iar rangul matricei diagonalizate (echivalentă cu matricea A) este evident r, iar acesta în baza teoremei este şi rangul matricei A. Exemplu 3.2.5. Să se afle rangul matricei: 3 4 1 −1 2 1 −1 2 0 2 A = −1 2 1 1 3 . 5 − 8 − 5 − 12 1 3 −7 8 9 13
82
Soluţie: 3 4 1 −1 2 3 4 1 0 0 0 0 1 −1 2 −5 − 4 −8 − 5 − 4 − 8 0 3 1 −1 2 0 0 3 2 A = −1 2 1 1 3 ≈ 0 1 3 4 7 ≈ 0 1 3 4 7 ≈ 5 − 8 − 5 − 12 0 6 − 10 − 8 − 16 0 6 − 10 − 8 − 16 1 3 −7 8 9 13 0 − 4 2 0 1 0 − 4 2 0 1
0 0 0 1 0 0 0 1 0 1 0 − 5 1 − 8 0 1 − 5 3 − 8 0 0 3 ≈ 0 1 −1 7 ≈ 0 −1 3 1 7 ≈ 0 3 0 6 − 10 2 − 16 0 2 − 10 6 − 16 0 0 − 4 2 2 0 1 0 0 − 4 1 0 1 0 ≈ 0 0 0
0 0 1 0 0 −2 0 0 0
2
0 1 0 0 − 1 ≈ 0 0 0 − 4 1 0 0 0 4 0
0 1 − 5 3 − 8 0 − 2 4 − 1 ≈ 0 0 0 0 0 2 − 4 1 0
0
0
0 0 0 . 0 0 0 0 0
0 1 0 0
0 0 1 0
0 0 0 0
Rezultă rang A = 3 . Observaţie 3.2.6. Se poate demonstra că, dacă A ∈ M m ,n (C) şi rang A = k ,
atunci există matricele Q ∈ M m (C) şi P ∈ M n (C) nesingulare astfel încât In M 0 Q ⋅ A ⋅ P ≈ L L L . 0 M 0
3.3. Calculul inversei unei matrice prin transformări elementare
Fie A ∈ M n (C) , A = (aij )i =1,n o matrice inversabilă, deci există o j =1, n
matrice B ∈ M n (C) B = (bij )i =1,n astfel încât A ⋅ B = B ⋅ A = I n . j =1, n
Plecând de la matricea A, vom determina matricea B astfel încât A⋅ B = In .
83
a11 a Avem: 21 L a n1
L a1n b11 b12 L a 2 n b21 b22 ⋅ L L L L L a nn bn1 bn 2
L b1n 1 0 L 0 L b2 n 0 1 L 0 a 22 . = L L L L L L L L bnn 0 0 L 1 an2 Necunoscutele b11 , b21 ,K, bn1 se obţin rezolvând sistemul liniar: a12
a11b11 + a12 b21 + K + a1n bn1 = 1 a b + a b + K + a b = 0 21 11 22 21 2 n n1 LLLLLLLLLLLLL a n1b11 + a n 2 b21 + K + a nn bn1 = 0 , folosind metoda lui Gauss, reprezentând sistemul printr-un tablou de forma a11 a12 L a1n M 1 a 21 a 22 L a 2 n M 0 L L L L M M (matricea extinsă a sistemului) a 0 a L a M n2 nn n1 Analog, obţinem matricele extinse: a11 a12 L a1n M 0 a11 a12 L a1n M 0 a 21 a 22 L a 2 n M 1 a 21 a 22 L a 2 n M 0 L L L L M M , L, L L L L M M . a a 0 a L a M a L a M 1 n2 nn n2 nn n1 n1 Deoarece elementele situate în stânga barelor verticale sunt aceleaşi, vom rezolva simultan cele n sisteme, prin metoda Gauss, înlocuindu-le prin următoarea matrice: a11 a12 L a1n M 1 0 L 0 a 21 a 22 L a 2 n M 0 1 L 0 L L L L M L L L L , a a L a M 0 0 L 1 n2 nn n1 având cele două componente, cea din stânga matricea A şi cea din dreapta matricea I n . Asupra acestora vom efectua simultan aceleaşi transformări elementare până când componenta din stânga, matricea A, devine matricea unitate I n . Componenta din dreapta, în urma transformărilor elementare efectuate, reprezintă matricea inversă A −1 .
84
Schematic avem: ( AM I n ) ≈ (L1 AM L1 ) ≈ L ≈ (Ln Ln−1 ⋅ K ⋅ L1 ⋅ AM Ln Ln−1 ⋅ K ⋅ L1 ) , unde Ln Ln −1 ⋅ K ⋅ L1 ⋅ A = I n şi Ln Ln −1 ⋅ K ⋅ L1 = A −1 . Observaţie 3.3.1. Dacă în urma transformărilor elementare efectuate, componenta din stânga nu devine I n , atunci matricea respectivă nu este inversabilă (în cazul în care nu am verificat că det A ≠ 0 ). 1 1 1 Exemplu 3.3.2. Să se afle inversa matricei A = 1 2 3 . 1 3 6
Avem: 0 0 1 1 1 M 1 0 0 1 1 1 M 1 0 0 1 1 1 M 1 1 2 3 M 0 1 0 ≈ 0 1 2 M − 1 1 0 ≈ 0 1 2 M − 1 1 0 ≈ 1 3 6 M 0 0 1 0 2 5 M − 1 0 1 0 0 1 M − 1 − 2 1 1 0 − 1 M 2 − 1 0 1 0 0 M 3 − 3 1 ≈ 0 1 2 M − 1 1 0 ≈ 0 1 0 M − 3 5 − 2 . Rezultă 0 0 1 M 1 − 2 1 0 0 1 M 1 − 2 1 3 −3 1 −1 A = − 3 5 − 2 . 1 −2 1
85
3.4. Probleme rezolvate (3) R3.4.1. Să se determine parametrul α ∈ R , astfel ca matricea: 1 2 3 −1 3 − 1 1 − 2 3 − 4 A= 2 1 − 2 1 − 4 − 2 2 3 1 α să aibă rangul 3. Soluţie: Efectuând transformările L4 + L3 , L2 + L1 şi L3 − 2L1 , obţinem: 1 −1 A= 2 − 2
2
3
−1
1 −2
3
1 −2 2 3
1 1
3 1 2 3 −1 3 1 0 0 −1 0 1 1 2 − 4 0 3 1 ≈ ≈ 0 − 3 − 8 3 − 10 −4 0 −1 − 8 1 2 α − 4 0 1 α 0 3 1
. În continuare transformările L4 + L3 , L3 + L2 ne dau 1 0 A≈ 0 0
0 0 1 1 0 −7 0 −7
0 0 1 2 −1 0 ≈ 5 − 11 0 5 α − 14 0
0 0 1 0 0 −7 0 −7 1 0 transformarea L4 − L3 ne furnizează A ≈ 0 0 Pentru ca rang A = 3 , trebuie ca α = 3 .
0 0 5 5 0 1 0 0
0 0 şi în sfârşit − 11 α − 14 0 0 0 0 0 0 . 1 0 0 0 α − 3 0
R3.4.2. Să se afle inversa matricei de ordinul n: 1 1 1 L 1 1 0 1 L 1 A=1 1 0 L 1 L L L L L 1 1 1 L 0 Soluţia I: Scăzând prima coloană din celelalte obţinem 86
0 2 −1 3 − 10 2 α − 4
0
1 0 0 1 −1 0 det A = 1 0 − 1 L L L 1 0 0
L 0 L 0 n −1 L 0 = (− 1) ≠ 0 , deci matricea este inversabilă. Fie: L L L −1 1 1 1 L 1 M 1 0 0 L 0 1 0 1 L 1 M 0 1 0 L 0 B = ( AM I n ) = 1 1 0 L 1 M 0 0 1 L 0 . L L L L L M L L L L L 1 1 1 L 0 M 0 0 0 L 1 Scăzând linia întâi din celelalte obţinem: 1 1 1 L 1 M 1 0 0 L 0 0 −1 0 L 0 M −1 1 0 L 0 0 0 −1 L 0 M −1 0 1 L 0 L L L L L M L L L L L 0 0 0 L −1 M −1 0 0 L 1 Înmulţind liniile 2, 3, L, n cu − 1 , iar apoi se face scăderea L1 − (L2 + L3 + K + Ln ) , obţinem:
1 0 0 L 0 M 2−n 1 1 L 1 −1 0 L 0 1 0 1 0 L 0 M 0 0 1 L 0 M 1 0 −1 L 0 . L L L L L M L L L L L 0 0 0 L 1 M 1 0 0 L − 1 2 − n 1 1 L 1 −1 0 L 0 1 Inversa căutată este A −1 = 1 0 −1 L 0 . L L L L L 1 0 0 L − 1 Soluţia a II-a: Vom afla inversa lui A, prin rezolvarea unui sistem.
87
x1 y1 x2 y Fie X = şi Y = 2 astfel încât AX = Y . M M x y n n Deoarece A este inversabilă, rezultă că X = A −1Y . Atunci AX = Y se scrie în mod explicit astfel: x1 + x 2 + K + x n = y1 x + x + K + x = y 3 n 2 1 x1 + x 2 + K + x n = y 3 LLLLLLLLL x1 + x 2 + K + x n −1 = y n Să exprimăm pe x1 , x 2 ,K, x n în funcţie de y1 , y 2 , K, y n . Scăzând fiecare ecuaţie a sistemului, membru cu membru, din prima ecuaţie, obţinem: x 2 = y1 − y 2 , x3 = y1 − y 3 ,K, x n = y1 − y n .
Atunci x 2 + x3 + K + x n = (n − 1) y1 − ( y 2 + y 3 + K + y n ) şi înlocuind în prima ecuaţie, obţinem: x1 = (2 − n ) y1 + y 2 + y 3 + K + y n .
Prin urmare X = A −1Y se scrie în mod explicit x1 = (2 − n ) y1 + y 2 + y 3 + K + y n x = y − y 1 2 2 x3 = y1 − y 3 LLLLL x n = y1 − y n Rezultă că inversa matricei A este matricea coeficienţilor nedeterminatelor y1 , y 2 , K, y n , adică 2 − n 1 1 −1 0 1 −1 A = 1 0 −1 L L L 1 0 0
88
L 1 L 0 L 0 . L L L − 1
R3.4.3. Să se rezolve ecuaţia matriceală: n 1 2 3 L 1 1 1 L 1 0 1 2 L n −1 0 1 1 L 1 0 0 1 L 1 ⋅ X = 0 0 1 L n − 2 . L L L L L L L L L L 0 0 0 L 0 0 0 L 1 1 n 1 1 1 L 1 1 2 3 L 0 1 1 L 1 0 1 2 L n −1 Soluţie: Fie A = 0 0 1 L 1 şi B = 0 0 1 L n − 2 . L L L L L L L L L L 0 0 0 L 1 0 0 0 L 1 Deoarece det A = 1 ≠ 0 , rezultă că matricea A este inversabilă. x1 y1 x2 y Fie X = şi Y = 2 astfel încât AX = Y , sau explicit M M x y n n x1 + x 2 + K + x n = y1 x + x + K + x = y 2 n 3 2 L L L L L L L L L x n = y n Exprimând x1 , x 2 ,K, x n în funcţie de y1 , y 2 , K, y n obţinem: x1 = y1 − y 2 x = y − y 2 2 3 L L L L L x n = y n Deoarece AX = Y ⇔ X = A −1Y , rezultă că 1 −1 0 L 0 0 1 −1 L 0 −1 A = L L L L L 0 0 0 L 1
89
Atunci din ecuaţia matriceală AX = B , rezultă 1 −1 0 L 0 1 2 3 L n 0 1 − 1 L 0 0 1 2 L n − 1 −1 = X = A ⋅B = ⋅ L L L L L L L L L L 0 0 0 L 1 0 0 0 L 1 1 1 1 L 1 0 1 1 L 1 0 0 1 L 1 . L L L L L 0 0 0 L 1
90
4. Matrice de ordinul doi si trei ca transformari geometrice în plan şi spaţiu 4.1 Aplicaţii liniare Definiţie 4.1.1. Aplicaţia f A : R 2 → R 2 , f A ( x, y ) = ( x' , y ') , unde x' x = A ⋅ , A ∈ M 2 (R ) , se numeşte aplicaţie liniară. y' y Matricea A se numeşte matricea asociată transformării f A .
Proprietate 4.1.2. Aplicaţia liniară f A : R 2 → R 2 , f A ( x, y ) = ( x' , y ') , unde x' x = A ⋅ , A ∈ M 2 (R ) , are următoarele proprietăţi: y' y a) f A (( x1 , y1 ) + ( x 2 , y 2 )) = f A ( x1 , y1 ) + f A (x 2 , y 2 ) , (∀) (x1 , y1 ), (x 2 , y 2 ) ∈ R 2 ; b) f A (α( x, y )) = α ⋅ f A ( x, y ) , (∀)α ∈ R , (x, y ) ∈ R 2 . Demonstraţie: x1 x 2 x1 + x 2 x x = A 1 + A 2 , rezultă imediat a) Deoarece A + = A y1 + y 2 y1 y2 y1 y 2 egalitatea de demonstrat;
x αx x b) De asemenea, din faptul A ⋅ α = A = αA , rezultă egalitatea y αy y propusă. Observaţie 4.1.3. 1) Proprietatea de mai sus este echivalentă cu egalitatea f A (α(x1 , y1 ) + β( x 2 , y 2 )) = αf A (x1 , y1 ) + βf A ( x 2 , y 2 ) , (∀)α, β ∈ R ,
(x1 , y1 ), (x2 , y 2 ) ∈ R 2 . 2) Avem f A (0,0 ) = (0,0 ) f A (− (x, y )) = − f A ( x, y ) , (∀) (x, y ) ∈ R 2 f I (x, y ) = ( x, y ) , transformarea identică. Definiţie 4.1.4. Ker f A = {( x, y ) f A ( x, y ) = (0,0 )} şi Im f A = {( x' , y ') f A ( x, y ) = ( x' , y '), ( x, y ) ∈ R 2 }. Observaţie 4.1.5. (∀)a, b ∈ R , (∀) (x1 , y1 ), (x 2 , y 2 ) ∈ Ker f A , rezultă a ( x1 , y1 ) + b( x 2 , y 2 ) ∈ Ker f A . 2
91
Definiţie 4.1.6. Fie aplicaţiile liniare f A : R 2 → R 2 , f A ( x, y ) = ( x' , y ') , unde x' x x' ' x' = A ⋅ şi g B : R 2 → R 2 , g B ( x' , y ') = ( x' ' , y ' ') , unde = B ⋅ , y' y y' ' y' atunci prin compunerea aplicaţiilor g B şi f A înţelegem g B o f A : R 2 → R 2 şi x' ' x (g B o f A )(x, y ) = g B ( f A (x, y )) = g B (x' , y ') = (x' ' , y ' ') , unde = BA . y' ' y Matricea asociată compunerii g B o f A este BA. 4.2. Matrice asociată unei transformări 4.2.1. Matricele asociate unor transformări liniare în plan În continuare, pentru simplificarea calculelor, vom nota punctul ( x, y ) x în coordonate plane, printr-o matrice punct . y Teoremă 4.2.2. Dacă pentru transformarea liniară f A : R 2 → R 2 , x x 1 a 0 c f A = A ⋅ , unde A ∈ M 2 (R ) , avem f A = şi f A = , atunci y y 0 b 1 d a c . A = b d 1 m n 1 m a m n ⋅ = = şi . Cum f A = Demonstraţie: Fie A = 0 p q 0 p b p q 0 m n 0 n c a c ⋅ = = , rezultă imediat A = . f A = 1 p q 1 q d b d Folosind teorema de mai sus, se poate calcula uşor matricele asociate diferitelor transformări liniare. 4.2.3. Matricea asociată simetriei în raport cu originea axelor de coordonate x x Fie transformarea liniară f A : R 2 → R 2 , f A = A ⋅ , unde y y
92
a c . Cum simetricul lui M ( x, y ) faţă de O este A = b d M ' ( x' , y ') = M ' (− x,− y ) (vezi figura) y M ( x, y ) M ' ( x' , y ') = M ' (− x,− y )
O
x
0 0 −1 0 1 − 1 este matricea rezultă că f A = şi f A = , adică A = 1 − 1 0 − 1 0 0 asociată simetriei în raport cu O. 4.2.4. Matricea asociată simetriei faţă de axa x' x x x Fie transformarea liniară f A : R 2 → R 2 , f A = A ⋅ , unde y y a c . Cum simetricul lui M ( x, y ) faţă de axa x' x este A = b d M ' ( x' , y ') = M ' (− x, y ) (vezi figura) y M ( x, y )
O M ' ( x' , y ') = M ' (− x, y ) 0 0 1 0 1 1 este matricea rezultă f A = şi f A = , adică A = 1 − 1 0 − 1 0 0 asociată simetriei faţă de axa x' x .
93
x
4.2.5. Matricea asociată simetriei faţă de axa y' y − 1 0 Procedând analog, ca la punctul precedent, se obţine că, A = 0 1 este matricea asociată simetriei faţă de axa y' y .
4.2.6. Matricea asociată rotaţiei de centru O şi unghi α y M ' ( x ' , y ') M ( x, y )
y' y O
x
x'
x
Fie α ∈ (− 2π,2π) . Rotaţia de centru O şi unghi orientat α este aceea transformare care asociază punctului O pe el însuşi şi oricărui punct M, punctul ∧
∧
M ' astfel încât OM ' = OM şi unghiurile M O M ' şi α sunt congruente şi au aceiaşi orientare. x x a c şi α ≥ 0 . Din Fie f A : R 2 → R 2 , f A = A ⋅ , unde A = y y b d figura de mai sus, rezultă x' = cos(θ + α ) = cos θ cos α − sin θ sin α , cos θ = x , sin θ = y . Deci x' = x cos α − y sin α . Analog, y ' = sin (θ + α ) = sin θ cos α + cos θ sin α , adică y ' = x sin α + y cos α . 1 cos α 0 − sin α şi f A = , rezultă că Cum f A = α α 0 sin 1 cos cos sin α − α este matricea asociată rotaţiei de unghi α în jurul A = α α sin cos originii.
94
4.2.7. Matricea asociată omotetiei de centru O şi raport k
y M ' ( x ' , y ') M ( x, y )
O
Q ( x ,0 )
Q ' ( x ' ,0 )
x
Fie k ∈ R , k ≠ 0 . Omotetia de centru O şi raport k este o transformare geometrică care asociază punctului M punctul M ' astfel încât OM ' = k ⋅ OM . Din figura de mai sus, rezultă că OQ' = k ⋅ OQ . Obţinem imediat că imaginea punctului ( x, y ) este (kx, ky ) . x x 1 k Fie f A : R 2 → R 2 , f A = A ⋅ . Cum f A = şi y y 0 0 0 0 f A = , rezultă că matricea asociată omotetiei de centru O şi raport k este 1 k k 0 . A = 0 k Observaţie Pentru k = −1 , omotetia este simetria în raport cu originea. 4.2.8. Matricea asociată proiecţiei vectorilor din R 2 pe Ox
y
M ( x, y )
O
M ' ( x ' , y ' ) = M ' ( x ,0 )
95
x
x x Fie transformarea liniară f A : R 2 → R 2 , f A = A ⋅ , unde y y a c 1 1 . Cum prOx M ( x, y ) = M ' ( x' , y ') = M ' ( x,0 ) , rezultă că f A = A = b d 0 0 0 0 1 0 este matricea asociată proiecţiei vectorilor şi f A = , adică A = 1 0 0 0
din R 2 pe Ox. 4.2.9. Matricele asociate unor transformări liniare în spaţiu x Vom nota punctul (x, y, z ) din spaţiu, printr-o matrice punct y . z
Procedând analog obţinem: 4.2.10. Matricea asociată simetriei în raport cu O x x 3 3 Fie transformarea liniară f A : R → R , f A y = A ⋅ y , unde z z a a' a' ' A = b b' b' ' . c c' c' '
Cum simetricul lui M ( x, y, z ) faţă de O este M ' (− x,− y,− z ) , rezultă că 0 0 0 0 0 1 − 1 −1 0 f A 0 = 0 , f A 1 = − 1 şi f A 0 = 0 , adică A = 0 − 1 0 este 0 0 1 − 1 0 0 0 0 − 1
matricea asociată simetriei în raport cu O.
96
4.2.11. Matricea asociată simetriei în raport cu planul xOy x x Fie transformarea liniară f A : R → R , f A y = A ⋅ y , unde z z a a' a' ' A = b b' b' ' . c c' c' ' Cum simetricul lui M ( x, y, z ) faţă de xOy este M ' ( x, y,− z ) , rezultă că 1 1 0 0 0 0 1 0 0 f A 0 = 0 , f A 1 = 1 şi f A 0 = 0 , adică A = 0 1 0 este 0 0 0 0 1 − 1 0 0 − 1 3
3
matricea asociată simetriei în raport cu planul xOy. 4.2.12. Matricea asociată rotaţiei în jurul axei Oz şi unghi α x x 3 3 Matricea asociată rotaţiei f Aα : R → R , f Aα y = A ⋅ y este z z cos α − sin α 0 Aα = sin α cos α 0 . 0 0 1
4.2.13. Matricea asociată omotetiei de centru O şi raport k
Cum OM ' = k ⋅ OM , rezultă imediat că matricea asociată omotetiei de x x 3 3 centru O şi raport k, unde f A : R → R , f A y = A ⋅ y , este z z k 0 0 A = 0 k 0 . 0 0 k
97
4.2.14. Matricea asociată proiecţiei paralele cu axa Oz pe planul xOy Rezultă imediat că matricea asociată proiecţiei paralele cu axa Oz pe x x 1 0 0 3 3 planul xOy, unde f A : R → R , f A y = A ⋅ y , este A = 0 1 0 . z z 0 0 0 4.3. Proiecţii în plan şi spaţiu 4.3.1. Determinarea proiecţiilor din plan
Aplicaţiile liniare de proiecţie, simetrie, rotaţie, date în diverse cazuri particulare, pot fi definite şi în general. Definiţie 4.3.2. O aplicaţie P : R 2 → R 2 cu proprietatea P o P = P , se numeşte proiecţie în plan, iar aplicaţia P : R 3 → R 3 cu proprietatea P o P = P , se numeşte proiecţie în spaţiu. Observaţie 4.3.3. O proiecţie este o aplicaţie idempotentă, adică P o42 P oK o P = P , pentru orice n ∈ N ∗ . 1 4 43 4 n ori
a b matricea proiecţiei P : R 2 → R 2 . Din P o P = P Fie A = c d 0 0 , c ∈ R , rezultă A 2 = A cu soluţiile A1 = O2 , A2 = I 2 , A3 = c 1 b a 1 0 , a ∈ R , b ∈ R ∗ . (vezi exerciţiul , c ∈ R şi A5 = a − a 2 A4 = − a 1 c 0 b R.1.2.5.) Corespunzător, obţinem aplicaţiile: P1 ( x, y ) = (0,0 ) (toate punctele se proiecteză în origine) P2 ( x, y ) = (x, y ) (toate punctele din plan se proiecteză pe plan) – aplicaţia identică P3 (x, y ) = (0, cx + y )
98
y
(x , y ) = P(x , y ) ' 1
' 1
1
1
(x, y )
(x , y ) = P(x, y )
(x1 , y1 )
'
'
O
x
Se observă că orice punct este dus pe axa Oy. Arătăm că dreptele ce unesc un punct arbitrar ( x, y ) cu imaginea sa (x ' , y ' ) = P( x, y ) au aceiaşi pantă.
y '− y cx + y − y = = −c (constantă) x'− x −x În concluzie P3 este proiecţia pe axa Oy paralelă cu dreapta d : cx + y = 0 . P4 ( x, y ) = ( x, cx ) (x, y ) y Avem m =
(x , y ) ' 1
' 1
(x , y ) '
'
O
x
(x1 , y1 ) Imaginea lui P este Im P = {( x, cx ) x ∈ R} , adică dreapta D: y = cx .
Punctele ( x, y ) şi P(x, y) se găsesc pe aceiaşi verticală. Aplicaţia P4 este proiecţia pe dreapta D: y = cx paralelă cu axa Oy. a − a2 1− a (ax + by ) . P5 ( x, y ) = ax + by, x + (1 − a ) y = ax + by, b b
99
1 − a t t ∈ R , adică dreapta de ecuaţie D: Se obţine Im P = t , b 1− a y= x. b Dreptele ce unesc un punct arbitrar cu imaginea lui, au panta y '− y a m= = − (constantă). x'− x b 1− a În concluzie P5 este proiecţia pe dreapta D: y = x paralelă cu b dreapta d : ax + by = 0 . Observaţie: Proiecţiile utilizate în anii anteriori, erau proiecţii particulare (proiecţii ortogonale), proiecţie pe o dreaptă paralelă cu o dreaptă ortogonală. Printr-un calcul mai anevoios sau prin alte metode se deduce că proiecţiile în spaţiu sunt: P1 ( x, y, z ) = (0,0,0 ) , P2 ( x, y, z ) = (x, y, z ) , P3 - proieţia pe un plan ce trece prin origine paralelă cu o dreaptă neparalelă cu planul, P4 - proieţia pe o dreaptă ce trece prin origine, paralelă cu un plan, neparalel cu dreapta.
4.4. Simetrii în plan şi spaţiu Definiţie 4.4.1. O aplicaţie liniară S : R 2 → R 2 , bijectivă cu proprietatea S = S −1 , se numeşte simetrie în plan, iar aplicaţia S : R 3 → R 3 , bijectivă cu proprietatea S = S −1 , se numeşte simetrie în spaţiu (sau involuţie). a b matricea simetriei S : R 2 → R 2 . Din S = S −1 sau Fie B = c d − 1 0 , S o S = I 2 rezultă B 2 = I 2 cu soluţiile B1 = − I 2 , B2 = I 2 , B3 = c 1 b a 1 0 2 , a ∈ R , b ∈ R ∗ . (vezi 1 − a , c ∈ R şi B5 = c ∈ R , B4 = − a c − 1 b exerciţiul R.1.2.4.) Analog ca la proiecţii, interpretarea geometrică a simetriilor este: S1 - este simetria faţă de origine, S 2 - este simetria identică, S 2 ( x, y ) = ( x, y ) S 3 - este simetria faţă de axa Oy, paralelă cu dreapta d : cx + 2 y = 0 100
S 4 - este simetria faţă de dreapta d : cx − 2 y = 0 , paralelă cu axa Oy. S 5 - este simetria faţă de dreapta D : (a − 1)x + by = 0 , paralelă cu dreapta
d : (a + 1)x + by = 0 . Analog cu proiecţiile din spaţiu, obţinem patru tipuri de simetrii: Simetria faţă de origine, simetria identică, simetria faţă de un plan ce trece prin origine, paralelă cu o dreaptă neparalelă cu planul şi simetria faţă o dreaptă ce trece prin origine, paralelă cu un plan neparalel cu dreapta.
4.4.2. Legătura între proiecţii şi simetrii Intuitiv se bănuieşte relaţia P( x ) =
1 (x + S (x )) . 2
P(x ) S (x ) x (Punctul P( x ) în care se proiectează x, este mijlocul segmentului ce uneşte x cu S (x ) ) Prorietate 4.4.3. Dacă P : R 2 R 3 → R 2 R 3 este o proiecţie, atunci S = 2 P − I este o simetrie şi reciproc, dacă S : R 2 R 3 → R 2 R 3 este o 1 simetrie, atunci P( x ) = (I + S ) este o proiecţie. 2 Demonstraţie: Dacă A este matricea lui P şi B matricea lui S, atunci A 2 = A şi B2 = I2 . Dacă B = 2 A − I 2 atunci B 2 = 4 A 2 − 4 A + I 2 = 4 A − 4 A + I 2 = I 2 . 1 Dacă A = (I 2 + B ) , atunci 2 1 1 1 A 2 = I 2 + 2 B + B 2 = (I 2 + 2 B + I 2 ) = (I 2 + B ) = A . 4 4 2
( )
(
( )
( )
( )
)
4.5. Izometrii în plan şi spaţiu Definiţie 4.5.1. O aplicaţie liniară T : R 2 → R 2 cu proprietatea T ( x, y ) = ( x' , y ') , unde x 2 + y 2 = x' 2 + y ' 2 pentru orice (x, y ) ∈ R 2 se numeşte izometrie în plan. Proprietate 4.5.2. O izometrie păstrează produsul scalar şi unghiul vectorilor. 101
Demonstraţie: Dacă T ( x1 , y1 ) = (x1' , y1' ) şi T ( x 2 , y 2 ) = (x 2' , y 2' ) , trebuie arătat că x1 x 2 + y1 y 2 = x1' x 2' + y1' y 2' . Avem T ( x1 + x 2 , y1 + y 2 ) = (x1' + x 2' , y1' + y 2' ) şi
(x1 + x2 )2 + ( y1 + y 2 )2 = (x1' + x2' )2 + (y1' + y 2' )2 ⇔ 2
2
2
2
⇔ x12 + x 22 + 2 x1 x 2 + y12 + y 22 + 2 y1 y 2 = x1' + x 2' + 2 x1' x 2' + y1' + y 2' + 2 y1' y 2' , 2
2
2
2
dar x12 + y12 = x1' + y1' şi x 22 + y 22 = x 2' + y 2' deci x1 x 2 + y1 y 2 = x1' x 2' + y1' y 2' . x1 x 2 + y1 y 2 , De asemenea, avem cos α = 2 x1 + y12 ⋅ x 22 + y 22 cos α' =
x1' x 2' + y1' y 2' 2
2
2
x1' + y1' ⋅ x 2' + y 2'
care sunt egale conform primei părţi.
2
Teoremă 4.5.3. O aplicaţie liniară T : R 2 → R 2 este izometrie dacă şi numai cos t − sin t sau dacă matricea ei este de forma M T = sin t cos t cos t sin t . M T = sin t − cos t a b avem Demonstraţie: Dacă matricea lui T este M T = c d T ( x, y ) = ( x' , y ') = (ax + by, cx + dy ) şi condiţia
x 2 + y 2 = (ax + by ) + (cx + dy ) , pentru orice (x, y ) ∈ R 2 ⇔ a 2 + c 2 = 1 , b 2 + d 2 = 1 şi ab + cd = 0 . Din a 2 + c 2 = 1 , b 2 + d 2 = 1 , rezultă că există t ∈ R şi s ∈ R astfel încât cos t = a , sin t = c şi analog sin s = b , cos s = d . Din ab + cd = 0 rezultă cos t sin s + sin t cos s = 0 ⇔ sin (s + t ) = 0 , de unde t + s ∈ {kπ k ∈ Z}. 2
2
cos t − sin t iar pentru Pentru t + s = 0 , s = −t , obţinem M T1 = sin t cos t t + s = π, s = π − t , cos t sin t . obţinem M T2 = sin t − cos t Observaţie 4.5.4. Matricele M T1 corespund rotaţiilor de unghi t în sens trigonometric iar M T2 este compunerea unei rotaţii cu o simetrie:
102
1 0 este matricea simetriei ortogonale faţă M T2 = M T1 ⋅ M S , unde M S = 0 − 1 de axa Ox. Observaţie 4.5.5. Analog se definesc izometriile spaţiului, ca aplicaţii liniare T : R 3 → R 3 cu proprietatea T ( x, y, z ) = ( x' , y ' , z ') , unde x 2 + y 2 + z 2 = x' 2 + y ' 2 + z ' 2 . Se poate deduce prin calcul analog sau prin alte metode că singurele aplicaţii liniare care sunt izometrii în spaţiu sunt rotaţiile în jurul unor drepte ce trec prin origine, simetrii sau compuneri de rotaţii cu simetrii. Pentru a obţine şi rotaţii în jurul unui punct arbitrar sau simetrii şi proiecţii arbitrare, trebuie introduse translaţiile cu care vom compune aplicaţiile liniare. Definiţie 4.5.6. O funcţie T( x0 , y0 ) : R 2 → R 2 , de forma T( x0 , y0 ) ( x, y ) = ( x + x0 , y + y 0 ) , (x, y ) ∈ R 2 iar (x 0 , y 0 ) ∈ R 2 este fixat, se
numeşte translaţie de vector (x 0 , y 0 ) .
Definiţie 4.5.7. Dacă f : R 2 (R 3 ) → R 2 (R 3 ) este o aplicaţie liniară şi T : R 2 (R 3 ) → R 2 (R 3 ) este o translaţie, atunci funcţiile g1 , g 2 : R 2 (R 3 ) → R 2 (R 3 ), g1 = T o f şi g 2 = f o T se numes aplicaţii afine. a b este matricea aplicaţiei f şi (x 0 , y 0 ) este Observaţie 4.5.8. Dacă A = c d x' x x0 vectorul translaţiei T, atunci g ( x, y ) = ( x' , y ') , unde = A ⋅ + , deci y' y y0 x' = ax + by + x0 g ( x, y ) = (ax + by + x0 , cx + dy + y 0 ) , (x, y ) ∈ R 2 iar se y ' = cx + dy + y 0 numesc ecuaţiile aplicaţiei.
103
4.6. Probleme rezolvate (4) R4.6.1. Fie S x = simetria faţă de axa x' x , S y = simetria faţă de y' y . Să se
găsească matricea asociată cu S x o S y . 1 0 , iar matricea asociată lui Soluţie: Matricea asociată lui S x este A = 0 − 1 − 1 0 . Rezultă că matricea asociată lui S x o S y este S y este B = 0 1 − 1 0 1 0 − 1 0 ⋅ = . B ⋅ A = 0 1 0 − 1 0 − 1 R4.6.2. Fie un hexagon regulat ABCDEF cu lungimea laturii egală cu 2, care raportat la sistemul xCy are vârfurile B şi E pe Cx, respectiv Cy. Se consideră un alt sistem x' Fy ' orientat pozitiv, axa absciselor fiind FA. a) Să se stabilească formulele de trecere de la xCy la x' Fy ' ; b) Să se determine coordonatele vârfurilor C şi E faţă de x' Fy ' . 2π Soluţie: Unghiul de rotaţie este dat de α = . Atunci, din formulele roto3 translaţiei x = x' cos α − y ' sin α + a y = x' sin α − y ' cos α + b se obţin formulele de trecere, unde: 1 3 x = x'− y '−2 2 2 3 1 y= x'− y '−2 3 2 2 b) Coordonatele punctului C faţă de noul sistem de axe le determinăm din condiţiile 1 3 y '−2 0 = − x'− 2 2 0 = 3 x'− 1 y '−2 3 2 2 Se obţine C 2,−2 3 . Analog rezultă E − 1,− 3 .
(
)
(
104
)
R4.6.3. Ce devine ecuaţia x 2 − y 2 − 2 = 0 , atunci când sistemul xOy se π roteşte cu un unghi α = ? 4 Soluţie: Coordonatele x,y ale unui punct oarecare de pe hiperbola dată, se vor transforma în coordonatele X,Y după formulele π π 2 2 2 (X − Y ) x = X cos − Y sin = X −Y = 4 4 2 2 2 π π 2 2 2 (X + Y ) y = X sin + Y cos = X +Y = 4 4 2 2 2 Înlocuind aceste valori în ecuaţia hiperbolei, obţinem: 2
2
2 ( X − Y ) − 2 ( X + Y ) − 2 = x − y −2= 2 2 1 2 1 = X − 2 XY + Y 2 − X 2 + 2 XY + Y 2 − 2 = 0 sau 2 2 XY + 1 = 0 . Deci, în noul sistem de coordonate hiperbola x 2 − y 2 − 2 = 0 , are ecuaţia XY + 1 = 0 , adică noile axe Ox,Oy coincid cu asimptotele hiperbolei. R4.6.4. Să se interpreteze geometric acţiunea aplicaţiilor f : R 2 → R 2 a) f ( x, y ) = (0,2 x + y ) ; (x, y ) ∈ R 2 b) f ( x, y ) = ( x,2 x ) ; (x, y ) ∈ R 2 c) f ( x, y ) = (3 x − y,6 x − 2 y ) ; (x, y ) ∈ R 2 0 0 1 0 Soluţie: Matricele aplicaţiilor sunt a) A = , b) A = , c) 2 1 2 0 3 − 1 A= care verifică relaţia A 2 = A , deci f este operator de proiecţie. 6 − 2 a) Proiecţia pe axa Oy paralelă cu dreapta d : 2 x + y = 0 . b) Proiecţia pe dreapta D : y − 2 x = 0 paralelă cu dreapta Oy. c) Proiecţia pe dreapta D : y − 2 x = 0 paralelă cu dreapta d : 3 x − y = 0 . R4.6.5. Să se interpreteze geometric acţiunea aplicaţiilor f : R 2 → R 2 a) f ( x, y ) = (− x,2 x + y ) ; (x, y ) ∈ R 2 b) f ( x, y ) = ( x,2 x − y ) ; (x, y ) ∈ R 2 c) f ( x, y ) = (3 x − y,8 x − 3 y ) ; (x, y ) ∈ R 2 2
2
(
)
(
105
)
− 1 0 1 0 3 − 1 Soluţie: Matricele a) A = , b) A = , c) A = care 2 1 2 − 1 8 − 3 verifică relaţia A 2 = I 2 , deci f este operator de simetrie. a) Simetria faţă de axa Oy paralelă cu dreapta x + y = 0 . b) Simetria faţă de dreapta x + y = 0 paralelă cu axa Oy. c) Simetria faţă de dreapta 2 x − y = 0 paralelă cu dreapta 4 x − y = 0 . R4.6.6. Să se arate că dacă A ∈ M 2 (R ) , A 2 = A , A ≠ O şi A ≠ I 2 atunci x' x proiecţia PA : R 2 → R 2 , PA ( x, y ) = ( x' , y ') cu = A ⋅ are proprietăţile y ' y a) Mulţimea Ker PA = {( x, y ) PA ( x, y ) = (0,0 )} este o dreaptă.
{
b) Mulţimea Im PA = ( x, y )( x, y ) ∈ R 2
} este o dreaptă.
c) PA are proiecţia pe dreapta Im PA , paralelă cu dreapta Ker PA . Soluţie: Din condiţiile date rangul matricei A este 1 deci sistemul omogen x A ⋅ X = O , X = , are o soluţie nebanală X 0 ≠ O şi orice altă soluţie este de y forma X = α ⋅ X 0 , α ∈ R , deci: x0 a) Ker PA = {( x, y ) x ⋅ y 0 = y ⋅ x0 } unde X 0 = . y0 b) Y ∈ Im PA ⇔ există X cu A ⋅ X = Y , adică sistemul neomogen A ⋅ X = Y este compatibil, condiţie echivalentă cu rang[A Y ] = rang A = 1 deci dacă A1
este o coloană nenulă a matricei A atunci Y = α ⋅ A1 , α ∈ R . Atunci pentru a A1 = , Im PA = {( x, y ) c ⋅ x = a ⋅ y}. c c) Evident că punctele planului sunt proiecţiile pe dreapta Im PA . Mai trebuie arătat că vectorul care uneşte un punct cu imaginea sa este paralel cu dreapta Ker PA , deci că A ⋅ X − X este proporţional cu vectorul X 0 (cu A ⋅ X 0 = O ).
(
)
Dar A( AX − X ) = A 2 X − AX = A 2 − A X = O deci vectorul X 1 = AX − X este soluţie a sistemului A ⋅ X 1 = O sau X 1 ∈ Ker PA .
R4.6.7. Să se arate că dacă A ∈ M 2 (R ) , A 2 = I 2 , A ≠ ± I 2 atunci simetria x' x S A : R 2 → R 2 , S A ( x, y ) = (x' , y ') cu = A ⋅ are proprietăţile: y ' y
106
a) Mulţimea Inv S A = {( x, y ) S A ( x, y ) = (− x,− y )} este o dreaptă
b) Mulţimea Fix S A = {( x, y ) S A (x, y ) = ( x, y )} este o dreaptă
x c) Pentru orice matrice X = există şi sunt unice matricele X 1 , X 2 cu y A ⋅ X 1 = − X 1 , A ⋅ X 2 = X 2 astfel ca X = X 1 + X 2 d) S A este simetria faţă de dreapta Inv S A , paralelă cu dreapta Fix S A . Soluţie: a) Din condiţiile date matricea ( A + I 2 ) are rangul 1, deci sistemul A ⋅ X = − X ⇔ ( A + I 2 ) ⋅ X = O are soluţii nebanale toate de forma α ⋅ X 0 , X0 ≠ O, α∈R . b) Matricea ( A − I 2 ) are rangul 1, deci sistemul A ⋅ X = X ⇔ ( A − I 2 ) ⋅ X = O are soluţii nebanale şi toate de forma β ⋅ X 1 , X 1 ≠ O , β ∈ R . c) Dacă ar exista X 1 şi X 2 am avea A ⋅ X = A ⋅ X 1 + A ⋅ X 2 = − X 1 + X 2 şi 1 1 X = X 1 + X 2 deci X 1 = ( X − A ⋅ X ) şi X 2 = ( X + A ⋅ X ) care verifică 2 2 condiţiile cerute. ( A ⋅ X 1 = − X 1 , A ⋅ X 2 = X 2 ) d) Arătăm că dreapta ce uneşte un punct cu imaginea sa, are direcţie fixă. Avem A ⋅ ( AX − X ) = A 2 X − AX = X − AX deci matricea X 1 = AX − X verifică relaţia A ⋅ X 1 = − X 1 deci X 1 ∈ Inv A , 1 1 1 1 A ( AX + X ) = A 2 X + AX = ( X + AX ) deci ( X + AX ) = X 2 este fix 2 2 2 2 A⋅ X2 = X2.
(
)
107
5. Determinanţi 5.1 Permutări Fie mulţimea A = {1,2, K , n} , n ∈ N ∗ . Definiţie 5.1.1. O aplicaţie bijectivă σ : A → A se numeşte permutare de gradul n. De regulă o permutare de gradul n se dă cu ajutorul unui tablou cu două linii: 2 L n 1 , σ = ( ) ( ) ( ) σ 1 σ 2 L σ n în care în linia a doua se scot în evidenţă imaginile prin σ ale numerelor 1,2, K, n . Mulţimea tuturor permutărilor de gradul n se noteză cu S n iar numărul lor este n! . 1 2 L n , adică aplicaţia Vom nota cu e permutarea identică, e = 1 2 L n e : A → A , e(k ) = k , (∀)k = 1, n .
2 L n 1 şi Definiţie 5.1.2. Fie α, β ∈ S n , α = α(1) α(2) L α(n ) 2 L n 1 , atunci prin compunerea permutărilor α o β β = β(1) β(2 ) L β(n ) n L 2 1 ∈ S n . înţelegem permutarea α o β = α(β(1)) α(β(2 )) L α(β(n )) Observaţie 5.1.3. În general, α o β ≠ β o α , unde α, β ∈ S n . 1 1 2 3 4 5 , β = Exemplu 5.1.4. Fie α, β ∈ S 5 , α = 3 2 5 4 1 3 1 2 3 4 5 1 2 3 4 5 1 2 αoβ = o = 2 5 4 1 3 3 1 5 2 4 4 2 atunci 1 2 3 4 5 1 2 3 4 5 ≠ o = 3 1 5 2 4 2 5 4 1 3 1 2 3 4 5 = β o α . = 1 4 2 3 5
108
2 3 4 5 , 1 5 2 4 3 4 5 ≠ 3 5 1
Proprietăţi 5.1.5. (ale compunerii permutărilor) a) (α o β) o γ = α o (β o γ ) , (∀)α, β, γ ∈ S n b) Permutarea identică e, are proprietatea e o α = α o e = α , (∀)α ∈ S n c) (∀)α ∈ S n , (∃)α −1 ∈ S n astfel încât α o α −1 = α −1 o α = e .
Permutarea α −1 se numeşte inversa permutării α 1 2 3 4 5 , atunci Exemplu 5.1.6. Dacă α ∈ S 5 , α = 4 1 5 2 3 1 2 3 4 5 . α −1 = 2 4 5 1 3 Definiţie 5.1.7. Deoarece compunerea permutărilor verifică proprietatea a), putem defini puterile lui α ∈ S n , astfel: α 2 = α o α , α 3 = α 2 o α ,
K , α n = α n −1 o α , n ∈ N , n ≥ 2 . Definiţie 5.1.8. O permutare τ ∈ S n , n ≥ 2 se numeşte transpoziţie dacă (∃)i, j ∈ A , i ≠ j , astfel încât j, k = i τ(k ) = i, k = j k , k ∈ A − {i, j}
şi vom nota τ = (ij ) . Proprietăţi 5.1.9. Pentru orice transpoziţie τ ∈ S n , avem: a) τ 2 = e b) τ −1 = τ Demonstraţie: Presupunem că τ = (ij ) , atunci: a) τ 2 (i ) = (τ o τ)(i ) = τ(τ(i )) = τ( j ) = i τ 2 ( j ) = (τ o τ )( j ) = τ(τ( j )) = τ(i ) = j , şi pentru orice k ∈ A − {i, j} , avem τ 2 (k ) = (τ o τ )(k ) = τ(τ(k )) = τ(k ) = k . Deci τ 2 (t ) = t , (∀)t ∈ A , de unde rezultă τ 2 = e . De aici obţinem imediat punctul b). Observaţie 5.1.10. Numărul tuturor transpoziţiilor de gradul n este C n2 . Teoremă 5.1.11. Orice permutare σ ∈ S n , n ≥ 2 , poate fi scrisă ca un produs finit de transpoziţii. Demonstraţie: Dacă M este o mulţime finită, vom nota cu card M numărul elementelor lui M. Pentru σ ∈ S n fie mσ = card{k σ (k ) ≠ k }. 109
Vom face un raţionament prin inducţie matematică după numărul mσ . Dacă mσ = 0 , atunci σ = e şi pentru orice transpoziţie τ avem σ = e = τoτ. Presupunem mσ > 0 şi că afirmaţia din enunţ este adevărată pentru permutările π ∈ S n cu mπ < mσ . Cum mσ > 0 există i ∈ A astfel încât σ(i ) ≠ i . Fie j = σ(i ) , τ = (ij ) şi π = τ o τ . Se observă că dacă σ(k ) = k , atunci k ≠ i şi k ≠ j , de unde π(k ) = σ(τ(k )) = σ(k ) = k Deci σ (k ) = k rezultă π(k ) = k şi cum π( j ) = σ(τ( j )) = σ(i ) = j , deducem că mπ < mσ . Conform ipotezei de inducţie există transpoziţiile τ1 , τ 2 ,K , τ m ∈ S n astfel încât π = τ1 o τ 2 o K o τ m . Aşadar, σ o τ = τ1 o τ 2 o K o τ m . Înmulţind la dreapta această egalitate cu τ şi ţinând cont că τ o τ = e , rezultă σ = τ1 o τ 2 o K o τ m o τ . 1 2 3 4 5 şi s-o scriem ca produs Exemplu 5.1.12. Fie permutarea σ = 2 5 4 1 3 de transpoziţii. Cum σ(1) = 2 , atunci σ(1) ≠ 1 şi considerăm transpoziţia τ1 = (12 ) . Facem 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 = . ⋅ produsul σ' = τ1 ⋅ σ = 2 1 3 4 5 2 5 4 1 3 1 5 4 2 3 Cum σ' (2 ) = 5 , atunci σ' (2 ) ≠ 2 şi considerăm transpoziţia τ 2 = (25) . Facem 1 2 3 4 5 . produsul σ' ' = τ 2 ⋅ σ' = 1 2 4 5 3 Cum σ' ' (3) = 4 , atunci σ' ' (3) ≠ 3 şi considerăm transpoziţia τ 3 = (34) . Facem 1 2 3 4 5 = (45) . produsul σ' ' ' = τ 3 ⋅ σ' ' = 1 2 3 5 4 Deci (45) = τ 3 ⋅ σ' ' = τ 3 ⋅ τ 2 ⋅ σ' = τ 3 ⋅ τ 2 ⋅ τ1 ⋅ σ sau (45) = (34 )(25)(12 )σ , de unde σ = (12 )(25)(34 )(45) (am înmulţit egalitatea de mai sus, la stânga, cu produsul (12)(25)(34) ). Definiţie 5.1.13. Fie σ ∈ S n . Spunem că permutarea σ prezintă o inversiune pentru perechea de numere (i, j ) ∈ A × A , i < j , dacă σ(i ) > σ( j ) . Vom nota cu Inv(σ ) numărul inversiunilor permutării σ . 110
1 2 3 4 5 , atunci Inv(σ ) = 3 , Exemplu 5.1.14. Dacă σ ∈ S 5 , σ = 1 4 3 2 5 deoarece σ prezintă inversiuni pentru perechile (2,3) , (2,4 ) şi (3,4) căci σ(2 ) > σ(3) , σ(2 ) > σ(4 ) şi σ(3) > σ(4 ) . n(n − 1) Observaţie 5.1.15. 0 ≤ Inv(σ ) ≤ C n2 = . 2 Inv (σ ) Definiţie 5.1.16. Numărul ε(σ ) = (− 1) ∈ {− 1,1} se numeşte signatura (semnul) permutării σ . Vom spune că σ este permutare pară (impară) dacă ε(σ ) = 1 (respectiv ε(σ ) = −1 ). Proprietate 5.1.17. Dacă τ = (ij ) ∈ S n , i < j , atunci ε(τ ) = −1 . Proprietate 5.1.18. Dacă σ ∈ S n , atunci are loc egalitatea σ(i ) − σ( j ) . ε(σ ) = ∏ i− j 1≤ i < j ≤ n
Demonstraţie: Produsul ε(σ ) =
σ(i ) − σ( j ) are C n2 factori. Să considerăm i− j 1≤ i < j ≤ n
∏
σ(i ) − σ( j ) ( i < j ). Dacă notăm σ(i ) = l şi σ( j ) = m , atunci l ≠ m şi i− j l , m ∈ {1,2, K , n}. Înseamnă că σ(i ) − σ( j ) = l − m , se simplifică cu numitorul σ(l ) − σ(m ) σ(m ) − σ(l ) din factorul dacă l < m sau cu numitorul din factorul l−m m−l dacă m < l . Prin simplificare obţinem (− 1) dacă (i, j ) este o inversiune şi (+ 1) în caz contrar. Cum orice numărător din produsul de la început se găseşte ca numitor în alt factor cu semnul + sau – , atunci produsul amintit, după simplificare va fi un produs de (+ 1) şi de (− 1) ; numărul (− 1) va fi egal cu numărul de inversiuni ale permutării σ . În concluzie produsul va fi egal cu ε(σ ) , adică tocmai egalitatea de demonstrat. Proprietate 5.1.19. Dacă σ, τ ∈ S n , atunci ε(στ) = ε(σ ) ⋅ ε(τ ) . factorul
Observaţii 5.1.20. 1) Dacă σ ∈ S n , atunci ε(σ 2 ) = 1 ; 2) Permutarea σ o τ este pară (respectiv impară) dacă ambele permutări σ şi τ au acelaşi semn (respectiv semne contrare). Proprietate 5.1.21. Pentru orice n ≥ 2 , numărul permutărilor pare (respectiv n! impare) din S n este . 2 111
5.2. Determinantul de ordinul n Determinanţi speciali Definiţie 5.2.1. Dacă A ∈ M n (C) , A = (aij )i =1,n şi S n este mulţimea j =1, n
permutărilor de gradul n, atunci numărul det A = ∑ ε(σ )a1σ (1) a 2σ (2 ) ⋅ K ⋅ a nσ (n ) σ∈S n
se numeşte determinantul matricei A. Din definiţia determinantului se deduc următoarele Proprietăţi 5.2.2. Dacă c1 , c 2 ,K, c n sunt coloanele matricei A, atunci: a) det (c1 , c 2 , K, c k + c k ' ,K, c n ) = det (c1 , c 2 , K, c k ,K, c n ) + det (c1 , c 2 ,K, c k ' ,K , c n ) ; b) det (c1 , c 2 , K, λc k , K , c n ) = λ det (c1 , c 2 ,K, c k ,K, c n ) , λ ∈ R ; c) det (cσ (1) , cσ (2 ) ,K , c σ (n ) ) = ε(σ ) ⋅ det (c1 , c 2 ,K, c n ) , σ ∈ S n . De asemenea, pentru A, B ∈ M n (C) , avem: d) det t A = det A ; e) det A = det A ; f) det ( A ⋅ B ) = det A ⋅ det B ;
g) det A n = (det A) , n ∈ N ∗ ; h) det (λA) = λn det A , λ ∈ R . n
Dezvoltarea determinanţilor Dacă A ∈ M n (C) , atunci: n
1) det A = ∑ aij Aij (dezvoltarea determinantului după linia i), unde j =1
Aij = (− 1)
i+ j
M ij ( Aij se numeşte complement algebric al elementului aij , iar
M ij se numeşte minor complementar al elementului aij ); n
2) det A = ∑ aij Aij (dezvoltarea după coloana j); i =1
3)
n
∑a j =1
ij
Akj = 0 , pentru k ≠ i şi
n
∑a i =1
ij
Aik = 0 , pentru k ≠ j ;
112
4) A ⋅ A∗ = det A ⋅ I n , unde A∗ = t (Aij ) = A ji , reciproca matricei A.
Determinanţi speciali 5.2.3. Determinantul Vandermonde se notează cu V (a1 , a 2 ,K, a n ) şi este definit prin 1 1 L 1 a a2 L an , V (a1 , a 2 , K , a n ) = 1 L L L L a1n −1 a 2n −1 L a nn −1 unde n ∈ N , n ≥ 2 şi a1 , a 2 ,K, a n ∈ C . Vom calcula valoarea lui, prin două metode. Metoda I Efectuând − a1 Ln −1 + Ln ,−a1 Ln − 2 + Ln −1 ,K,−a1 L1 + L2 , obţinem: 1
1
1
0
a 2 − a1
a3 − a1
V (a1 , a 2 , K , a n ) = 0 L 0
a 2 (a 2 − a1 ) L
a 3 (a3 − a1 ) L
L L L L
1 a n − a1
a n (a n − a1 ) = L
a 2n − 2 (a 2 − a1 ) a3n − 2 (a3 − a1 ) L a nn − 2 (a n − a1 )
= (a 2 − a1 )(a3 − a1 ) ⋅ K ⋅ (a n − a1 ) ⋅ V (a 2 , a3 , K, a n ) , care reprezintă o relaţie de recurenţă. Deci, V (a1 , a 2 ,K , a n ) = (a 2 − a1 )(a3 − a1 ) ⋅ K ⋅ (a n − a1 ) ⋅ V (a 2 , a3 , K, a n ) V (a 2 , a3 ,K, a n ) = (a3 − a 2 )(a 4 − a 2 ) ⋅ K ⋅ (a n − a 2 ) ⋅ V (a3 , a 4 , K, a n ) ………………………………… V (a n − 2 , a n −1 , a n ) = (a n −1 − a n − 2 )(a n − a n − 2 ) ⋅ V (a n −1 , a n ) Făcând produsul, se obţine: V (a1 , a 2 , K , a n ) = ∏ (a j − ai ) . 1≤i < j ≤ n
Metoda a II-a Fie polinomul P( x ) = V (a1 , a 2 , K, a n −1 , x ) de gradul n − 1 . Observăm că P(a1 ) = P(a 2 ) = K = P(a n −1 ) = 0 (am exclus cazul banal în care două dintre numerele a1 , a 2 ,K, a n −1 sunt egale). Deducem că polinomul P este de forma: n −1
P ( x ) = a∏ ( x − a k ) k =1
113
Dezvoltând determinantul V (a1 , a 2 ,K , a n −1 ) , după ultima linie, a fiind
coeficientul lui x n −1 , deducem a = V (a1 , a 2 ,K , a n −1 ) , deci n −1
V (a1 , a 2 ,K, a n −1 , x ) = V (a1 , a 2 ,K, a n −1 ) ⋅ ∏ ( x − a k ) k =1
Pentru x = a n , obţinem: n −1
V (a1 , a 2 ,K , a n ) = V (a1 , a 2 ,K, a n −1 ) ⋅ ∏ (a n − a k ) k =1
şi ţinând cont de această relaţie de recurenţă şi de egalitarea V (a1 , a 2 ) = (a 2 − a1 ) , obţinem V (a1 , a 2 , K , a n ) = ∏ (a j − ai ) . 1≤i < j ≤ n
5.2.4. Determinantul Vandermonde lacunar Fie a1 , a 2 ,K, a n ∈ C , k ∈ {0,1, K , n − 1}. Se numeşte determinant Vandermonde lacunar, şi se notează cu Vk (a1 , a 2 ,K, a n ) , determinantul
Vk (a1 , a 2 , K , a n ) =
1
1
L
1
a1
a2
L
an
k −1 1 k +1 1
k −1 2 k +1 2
L a nk −1
a
a
a L
a L
L a nk +1 L L
a1n
a 2n
L
a nn
Pentru calculul lui, considerăm egalităţile n
V (a1 , a 2 ,K, a n , x ) = V (a1 , a 2 ,K, a n ) ⋅ ∏ ( x − a k ) =
(
= V (a1 , a 2 , K , a n ) ⋅ x − S1 x n
k =1
n −1
+ S2 x
n−2
)
− K + (− 1) S n , n
unde S k este suma Vietè de ordinul k. Pe de altă parte dezvoltând determinantul V (a1 , a 2 , K, a n , x ) după ultima coloană, obţinem n+2 n V (a1 , a 2 , K , a n , x ) = (− 1) V0 − xV1 + x 2V2 + K + (− 1) x nVn Identificând coeficienţii celor două forme ale polinomului V (a1 , a 2 , K, a n , x ) obţinem:
(
114
)
n
V0 (a1 , a 2 ,K , a n ) = V (a1 , a 2 , K, a n ) ⋅ ∏ a k k =1
Vk (a1 , a 2 ,K, a n ) = V (a1 , a 2 ,K , a n ) ⋅ S n − k , k = 1, n .
5.2.5. Determinant polinomial Fie Pi ∈ C[X ] polinom de grad cel mult n − 1 , i = 1, n şi fie x j ∈ C , j = 1, n . Determinantul
P1 ( x1 )
det (Pi (x j )) =
P1 ( x 2 ) L P1 ( x n )
P2 ( x1 ) P2 ( x 2 ) L P2 ( x n ) L L L L Pn ( x1 ) Pn ( x 2 ) L Pn ( x n )
se numeşte determinant polinomial. Dacă P1 ( x ) = a11 + a12 x + K + a1n x n −1
P2 ( x ) = a 21 + a 22 x + K + a 2 n x n −1 ……………… Pn ( x ) = a n1 + a n 2 x + K + a nn x n −1
şi notăm P = (Pik )i ,k =1,n matricea coeficienţilor polinoamelor Pi , i = 1, n
observând egalitatea (Pi (x j )) = (Pik )(x kj −1 ) , deducem că
det (Pi (x j )) = det P ⋅ V (x1 , x 2 ,K, x n ) .
5.2.6. Determinant circular Fie a1 , a 2 ,K, a n ∈ C . Se numeşte determinant circular al numerelor a1 , a 2 , K, a n şi se notează cu C (a1 , a 2 , K, a n ) determinantul a1
a2 L
an
a2
a3 L
a1
C (a1 , a 2 , K , a n ) = a 3 a 4 L L L L an
115
a2 . L
a1 L a n −1
Pentru calculul lui, considerăm ecuaţia binomă x n − 1 = 0 , n ≥ 2 , ale cărei rădăcini sunt ε1 , ε 2 ,K, ε n numite rădăcini de ordinul n ale unităţii şi construim un determinant Vandermonde de forma: 1 1 L 1 ε1 ε2 L εn 2 V (ε1 , ε 2 , K , ε n ) = ε1 ε 22 L ε n2 L L L L ε1n −1 ε 2n −1 L ε nn −1 Făcând produsul C (a1 , a 2 ,K, a n ) ⋅ V (ε1 , ε 2 ,K, ε n ) , obţinem: C (a1 , a 2 ,K, a n ) ⋅ V (ε1 , ε 2 ,K, ε n ) =
a1 + a 2 ε1 + K + a n ε1n −1 a + a3 ε1 + K + a1ε1n −1 = 2 L
a n + a1ε1 + K + a n −1ε1n −1
a1 + a 2 ε 2 + K + a n ε 2n −1 a 2 + a3 ε 2 + K + a1ε 2n −1 L
L L L
a1 + a 2 ε n + K + a n ε nn −1 a 2 + a3 ε n + K + a1ε nn −1 L
a n + a1ε 2 + K + a n −1ε 2n −1 L a n + a1ε n + K + a n −1ε nn −1 .
Considerăm polinomul f ( x ) = a1 + a 2 x + a3 x 2 + K + a n x n −1 astfel că produsul precedent se scrie: ε1n f (ε1 ) ε n2 f (ε 2 ) L ε nn f (ε n ) ε1n −1 f (ε1 ) ε n2 −1 f (ε 2 ) L ε nn −1 f (ε n ) L ε1 f (ε1 )
L ε 2 f (ε 2 )
L L
L ε n f (ε n )
= f (ε1 ) ⋅ f (ε 2 ) ⋅ K ⋅ f (ε n ) ⋅
ε1n ε1n −1
ε n2 L ε nn ε n2 −1 L ε nn −1
L ε1
L ε2
L L
. Ultima linie se poate aduce pe prima linie prin n − 1 schimbări. Procedând analog cu celelalte linii, obţinem: C (a1 , a 2 ,K, a n ) ⋅ V (ε1 , ε 2 , K , ε n ) = (− 1)
⋅ f (ε1 ) ⋅ f (ε 2 ) ⋅ K ⋅ f (ε n ) ⋅ V (ε1 , ε 2 , K , ε n ) =
( n −1)+ ( n − 2 )+K+ 2 +1
= (− 1)
n ( n +1) 2
L εn
⋅ f (ε1 ) ⋅ f (ε 2 ) ⋅ K ⋅ f (ε n ) ⋅ V (ε1 , ε 2 , K , ε n ) ,
de unde simplificând cu V (ε1 , ε 2 ,K, ε n ) , obţinem: C (a1 , a 2 , K, a n ) = (− 1)
n ( n −1) 2
⋅ f (ε1 ) ⋅ f (ε 2 ) ⋅ K ⋅ f (ε n ) ,
unde f (ε ) = a1 + a 2 ε + a3 ε 2 + K + a n ε n −1 , iar ε este o rădăcină a ecuaţiei xn −1 = 0 . 116
5.2.7. Determinant Cauchy Fie ai , b j ∈ C , i, j = 1, n . Se numeşte determinant Cauchy al numerelor ai , b j , determinantul 1 a1 + b1 1 D(ai ,b j ) = a 2 + b1
1 a1 + b2 1 a 2 + b2
1 a1 + bn 1 a 2 + bn .
1 1 1 a n + b1 a n + b2 a n + bn Pentru calculul său scădem ultima linie din celelalte linii, dăm factori pe linii şi pe coloane apoi scădem ultima coloană din celelalte coloane şi dăm din nou factori. Se obţine relaţia de recurenţă: Dn −1 n −1 (a n − a k )(bn − bk ) Dn = ⋅∏ , a n + bn k =1 (a n + a k )(bn + bk ) de unde V (a1 , a 2 ,K, a n ) ⋅ V (b1 , b2 , K, bn ) D(ai ,b j ) = . n ∏ (a1 + b j ) i , j =1
5.3. Funcţii polinomiale de tip determinant În continuare este expusă o metodă de stabilire a unor proprietăţi ale determinanţilor cu ajutorul unor funcţii polinomiale de tipul: det(A+xB), unde A, B ∈ M n (C) Teoremă. 5.3.1. Fie A, B ∈ M n (C) . Atunci f ( x ) = det ( A + xB ) este un polinom de grad ≤ n având termenul liber egal cu det A şi coeficientul lui xn egal cu det B. Demonstraţie: Din dezvoltarea lui det(A+xB) cu definiţia determinantului, rezultă cã f este un polinom de grad ≤ n iar termenul liber este egal cu f (0 ) = det A . Coeficientul lui x n este determinat de: 1 f (x ) 1 lim = lim n det( A + xB) = lim det A + B = det B . x →∞ n →∞ x n n →∞ x x
117
Exemplu 5.3.2. Dacă A, B ∈ M 2 (C) , atunci det ( A + B ) + det ( A − B ) = 2(det A + det B ) . Într-adevăr, conform teoremei 5.5.1. putem scrie: det ( A + xB ) = det A + ax + det B ⋅ x 2 Atunci, pentru x = 1 şi x = −1 , obţinem: det ( A + B ) = det A + a + det B det ( A − B ) = det A − a + det B , a ∈ C de unde, prin adunare obţinem relaţia de demonstrat. 5.4. Derivata unui determinant Teoremă 5.4.1. Fie f ij : R → R funcţii derivabile pe R, i, j ∈ {1,2, K , n}, iar
f :R →R,
f11 ( x ) f (x ) f ( x) = 21 L f n1 (x )
f 12 ( x ) L
f 22 ( x ) L L L f n 2 (x ) L
Arătaţi că f este derivabilă pe R şi: f11 ( x ) f12 ( x ) L L L L n f ′( x ) = ∑ f j′1 ( x ) f j′2 (x ) L j =1 L L L f n1 ( x ) f n 2 ( x ) L
L L L L L
f1n ( x ) f 2 n ( x ) . L f nn ( x ) f 1n ( x ) − f jn′ ( x ) , (∀)x ∈ R . L
f nn ( x )
Demonstraţie: Faptul că funcţia f este derivabilă pe R rezultă din aceea că: dacă funcţiile g1 , g 2 , K, g n sunt funcţii derivabile pe R, atunci funcţia g1 ⋅ g 2 ⋅ K ⋅ g n este derivabilă pe R şi ′
(g1 ⋅ g 2 ⋅ K ⋅ g n ) În continuare, avem f ( x ) =
n
= ∑ g1 ⋅ g 2 ⋅ K ⋅ g ′j ⋅ K ⋅ g n . j =1
∑ ε(σ) ⋅ f ( ) (x ) ⋅ f
σ∈S n
1σ 1
2σ(2 )
(x ) ⋅ K ⋅ f nσ(n ) (x )
(1)
Din (1) prin derivare, rezultă: n
f ′( x ) = ∑ ∑ ε(σ ) ⋅ f 1σ (1) ( x ) ⋅ f 2 σ (2 ) ( x ) ⋅ K ⋅ f j′σ ( j ) ( x ) ⋅ K f nσ (n ) ( x ) , j =1 σ∈S n
adică tocmai relaţia de demonstrat. 118
Exemple 5.4.2. Să se demonstreze că: sin( x + α ) sin( x + β ) sin( x + γ ) sin α cos( x + α ) cos( x + β ) cos( x + γ ) = cosα a b c a
sin β
sin γ
cos β b
cos γ , c
(∀)x ∈ R , unde α,β,γ,a,b,x ∈ R. Într-adevăr, fie f : R → R , sin( x + α ) sin( x + β ) sin( x + γ ) f(x)= cos( x + α ) cos( x + β ) cos( x + γ ) a b c Evident f este derivabilă şi conform relaţiei demonstrate, putem scrie: cos( x + α ) cos( x + β ) cos( x + γ f ′( x ) = cos( x + α ) cos( x + β ) cos( x + γ ) + a b c sin( x + α )
sin( x + β )
sin( x + γ )
+ − sin( x + α ) − sin( x + β ) − sin( x + γ ) + a b c sin( x + β)
sin( x + β)
sin( x + γ )
+ cos( x + α ) cos( x + β) cos( x + γ ) = 0, (∀)x ∈ R . 0 0 0 Cum f ′( x ) = 0, (∀)x ∈ R rezultă că f este constantă pe R şi deci f(x)=f(0), (∀)x ∈ R , adică tocmai ceea ce trebuia demonstrat. Fie a1 , a 2 , K, a n , x ∈ R. Să se arate că: x + a1 x L x
x x + a2 L x
x L x L = L L L x + an
= ( a2 a3 ⋅ ... ⋅ an + a1a3 a4 ⋅ ... ⋅ an + K + a1a2 ⋅ ... ⋅ an −1 ) x + a1a2 ⋅ ... ⋅ an
119
x + a1
Soluţie: Fie f(x) =
x
L
x + a2 L
x L x
L x
x x
L L L x + an
, x ∈ R.
Se observă imediat că f ′′( x ) = 0 , (∀)x ∈ R . Deci, (∃)A, B ∈ R astfel încât f(x) = Ax+B, (∀)x ∈ R .
Evident avem: B=f(0)=
A = f ′(0 ) =
a1
0
L
0
0
a2 L
0
L L L L 0 0 L an
1
1
L
1
0
a2 L
0
L L L L 0 0 L an
= a1 a 2 ...a n , iar
+…+
a1 0 L L 0 0 a2 L L 0 L L L L L = a 2 a3 K a n + a1 a3 a 4 K a n + K + a1 a 2 K a n −1 , 0 0 L a n −1 0 1 1 L 1 1 de unde rezultă concluzia.
120
5.5. Probleme rezolvate (5.1) R5.2.1. Fie σ ∈ S n o permutare de ordinul n. a) Demonstraţi că există k ∈ N ∗ , 1 ≤ k ≤ n! astfel încât σ k = e ; b) Dacă m, p ∈ N ∗ , cu proprietatea σ m = σ p = e atunci σ (m, p ) = e ; c) Dacă h este cel mai mic număr natural nenul cu proprietatea σ h = e , demonstraţi că pentru orice m ∈ N ∗ cu σ m = e , avem h m .
Soluţie: a) Considerăm şirul de permutări σ, σ 2 , σ 3 ,K , şir de elemente din S n . Cum S n este mulţime finită, există numerele naturale i, j, 0 ≤ i < j astfel încât
σ i = σ j (aceasta deoarece în caz contrar ar rezulta că mulţimea S n ar fi infinită). Rezultă σ j −i = e şi alegând j − i = k , obţinem σ k = e ; b) Dacă m, p ∈ N ∗ , atunci există r, q ∈ Z astfel încât (m, p ) = r ⋅ m + q ⋅ p , de
unde σ (m, p ) = σ r ⋅m + q⋅ p = (σ m ) ⋅ (σ p ) = e . c) Aplicând teorema împărţirii cu rest pentru m şi h, avem m = h ⋅ q + r , de unde σ r = e , dar 0 ≤ r < h , contradicţie dacă r ≠ 0 . Deci r = 0 şi atunci h m . r
q
1 2 3 4 5 6 7 . R5.2.2. Fie permutarea u = 7 6 5 4 3 2 1 Să se arate că nu există nici o permutare x ∈ S 7 astfel încât x 2 = u . Soluţie: Presupunem că (∃)x ∈ S 7 astfel încât x 2 = u . Atunci ε(x 2 ) = ε(u ) .
Cum ε(x 2 ) = 1 şi ε(u ) = (− 1) permutare.
C72
= (− 1) = −1 , rezultă că nu există o astfel de 21
n
k . Să se arate că k =1 ϕ(k )
R5.2.3. Pentru o permutare ϕ ∈ S n se notează S n (ϕ) = ∑
S n (ϕ) este minimă dacă ϕ este permutarea identică. Soluţie: Aplicând inegalitatea lui Cauchy-Buniakowski, obţinem: n k n 1 n ∑ 1 ∑ ∑ ≥ k =1 ϕ(k ) k =1 k k =1 ϕ(k )
121
2
n
Dar
∑ k =1
n
k
1 k
∑ ϕ(k ) ≥
n
1
=∑
ϕ(k )
k =1
1
+
1
datorită bijecţiei ϕ , deci
+K+
1
. Deci min S n (ϕ) =
1
+
1
+K+
1
şi se 1 2 n 1 2 n realizează când în inegalitatea lui Cauchy-Buniakowski are loc egalitate, adică ϕ(k ) = k . n n n 1 1 1 Deoarece ∑ > ∑ şi lim ∑ = ∞ , rezultă că lim S n (ϕ) = ∞ . n → ∞ n→∞ k k =1 k k =1 k k =1 R5.2.4. Fie n ∈ N ∗ . Să se afle permutarea σ ∈ S n în cazurile: 1 2 n a) = =L= ; σ(1) σ(2) σ(n ) b) 1 ⋅ σ(1) = 2 ⋅ σ(2 ) = L = n ⋅ σ(n ) . 1 2 n 1+ 2 +K+ n Soluţie: a) Putem scrie = =L= = = 1, σ(1) σ(2) σ(n ) σ(1) + σ(2) + K + σ(n ) de unde rezultă 1 2 L n . σ(1) = 1, σ(2 ) = 2, K , σ(n ) = n , adică σ = e = 1 2 L n b) Din 1 ⋅ σ(1) = n ⋅ σ(n ) rezultă σ(1) = n şi σ(n ) = 1 , deci iσ(i ) = n , k =1
(∀)i = 2, n − 1 .
Obţinem (n − 1)σ(n − 1) = n , de unde σ(n − 1) = 1 +
1 , de unde rezultă n = 2 n −1
1 2 . şi atunci σ = 2 1
Probleme rezolvate (5.2)
(
)
R5.4.1. Dacă A, B ∈ M n (R ) astfel încât AB = BA , atunci det A 2 + B 2 ≥ 0 .
Soluţie: Din AB = BA avem A 2 + B 2 = ( A + iB )( A − iB ) = ( A + iB )( A + iB ) şi deci putem scrie det ( A2 + B 2 ) = det ( A + iB )( A + iB ) = , ceea 2 = det ( A + iB ) ⋅ det ( A + iB ) = det ( A + iB ) ⋅ det ( A + iB ) = det ( A + iB ) ≥ 0 ce încheie demonstraţia.
122
R5.4.2. Să se demonstreze că dacă X , Y ∈ M n (C) şi XY = I n , atunci şi YX = I n . Soluţie: Din XY = I n rezultă det ( XY ) = det (I n ) = 1 sau det X ⋅ det Y = 1 , adică det X ≠ 0 şi det Y ≠ 0 , ceea ce înseamnă că X şi Y sunt inversabile. Fie X −1 inversa lui X. Înmulţind relaţia XY = I n (la stânga) cu X −1 obţinem Y = X −1 şi deci YX = X −1 ⋅ X = I n . R5.4.3. Fie p şi q două numere reale astfel încât p 2 − 4 p < 0 . Să se arate că dacă n este un număr natural impar şi A ∈ M n (R ) atunci A 2 + pA + qI n ≠ On , unde I n este matricea unitate de ordinul n şi On este matricea nulă de ordinul n.
Soluţie: Presupunem prin absurd că A 2 + pA + qI n = On . Atunci din identitatea 2
p p 2 − 4q A 2 + pA + qI n = A + I n − In 2 4 rezultă 2
p p 2 − 4q In A + In = 2 4 Aplicând determinantul în ambii membri, obţinem: n
2
p 2 − 4q p . det A + I n = 2 4 Membrul stâng al egalităţii este pozitiv iar membrul drept al egalităţii este strict negativ deoarece p 2 − 4 p < 0 şi n este impar, deci am ajuns la o contradicţie şi rezultă deci că A 2 + pA + qI n ≠ On . R5.4.4. Dacă n ∈ 2N + 1 şi A ∈ M n (R ) cu proprietatea că A 2 = On sau
A 2 = I n , atunci det ( A + I n ) ≥ det ( A − I n ) .
Soluţie: Dacă A 2 = On , atunci avem 2
2
1 1 1 det ( A + I n ) = det A 2 + A + I n = det A + I n = det A + I n ≥ 0 (1) 4 2 2 De asemenea, avem: n det ( A − I n ) = det ( − ( I n − A ) ) = ( −1) det ( I n − A ) = 2
1 1 n = ( −1) det I n − A + A2 = ( −1) det I n − A = 4 2 n
123
2
1 = (− 1) det I n − A ≤ 0 , deoarece n ∈ 2N + 1 2 Din (1) şi (2) deducem cerinţa enunţului. Dacă A 2 = I n , adică matricea A este involutivă, atunci n
(2)
(det ( A + I n ))2 = det( A + I n )2 = det (A 2 + 2 A + I n ) = det(2 A + 2 I n ) = 2 n det( A + I n ) ≥ 0
(3) Totodată: n
1 1 det ( A − I n ) = (− 1) det (I n − A) = (− 1) det (2 I n − 2 A) = − det (2 I n − 2 A) = 2 2 n
n
n
n
1 1 2 2 = − det ( A − I n ) = − (det ( A − I n )) ≤ 0 (4) 2 2 Din (3) şi (4) deducem cerinţa enunţului şi în acest caz. R5.4.5. Să se calculeze determinantul de ordinul n: 8 5 0 L L L 0 3 8 5 L L L 0 ∆n = L L L L L L L . 0 0 0 L 3 8 5 0 0 0 L 0 3 8 Soluţie: Dezvoltând după prima coloană obţinem relaţia de recurenţă ∆ n = 8∆ n −1 − 15∆ n − 2 , cu ecuaţia caracteristică r 2 − 8r + 15 = 0 , de unde r1 = 3 şi r2 = 5 . Rezultă ∆ n = α ⋅ 3 n + β ⋅ 5 n cu ∆ 1 = 8 , ∆ 2 = 49 . Obţinem în final 1 ∆ n = 5 n +1 − 3 n +1 , n ≥ 1 . 2 R5.4.6. Să se calculeze determinantul cos α 1 0 0 0 L 1 2 cos α 1 0 0 L 0 1 2 cos α L 0 0 ∆n = , unde α ∈ R . L L L L L L 0 0 0 1 L 2 cos α 0 0 0 L 1 2 cos α
(
)
124
Soluţie: Dezvoltând după prima linie obţinem relaţia de recurenţă ∆ n = 2 cos α∆ n −1 − ∆ n − 2 , n ≥ 3 . Avem ∆ 1 = cos α , ∆ 2 =
cos α 1 = 2 cos 2 α − 1 = cos 2α . Presupunând 1 2 cos α
că ∆ k = cos kα , (∀)k = 1, n , avem:
∆ n +1 = 2 cos α ⋅ cos nα − cos(n − 1)α = cos(n + 1)α + cos(n − 1)α − cos(n − 1)α = cos(n + 1)α . Conform principiului inducţiei matematice complete avem ∆ n = cos nα ,
(∀)n ∈ N ∗ .
R5.4.7. Să se calculeze: 1 + x12 x1 x 2 x 2 x1 2 + x 22 ∆n = L L x n x1 xn x2
x1 x3
L
x1 x n
x 2 x3 L
x2 xn
L
L
, unde x k ∈ C , k = 1, n .
L
x n x3 L n + x n2
Soluţie: Fie x k ≠ 0 , (∀)k = 1, n , atunci putem scrie: x1 + ∆ n = x1 x 2 K x n ⋅
x + 1 1 x1 n = ∏ x k ⋅ x1 k =1 L x1
x2 x2 + L x2
x1
1 x1
x2 x2 +
L
L
x1
x2
L xn 2 x2
2 x2
L
xn
L
xn
L
L
L xn +
x1 +
1 x1
n xn
x2 x2 +
L xn +
x1
L L L xn
L
L
x1
x2
125
=
0 L 0 = L L n L x n L
2 x2
1 x1 n = ∏ xk ⋅ 0 k =1 L x1
0
x1 +
0
L
2 n L 0 + x2 xn L L L x2
1 x1
x2 x2 +
x1
L xn
L
L
x1
x2
L x n −1 = (n − 1)!⋅x n2 + n∆ n −1 L L 1 L x n −1 + x n −1 x n −1
L 1 x2
. x2 x2 x2 ∆ n = n!1 + 1 + 2 + K n . Dacă 1 2 n (∃)k ∈ N ∗ astfel încât xk = 0 , atunci ∆ n se dezvoltă după linia k şi se procedează analog, rezultatul rămânând acelaşi.
Cum
∆ 1 = 1 + x12 ,
rezultă
imediat
1 − ain b nj R5.4.8. Să se determine det 1 − ai b j
Soluţie: Avem aij =
1 − ain b nj 1 − ai b j
. i , j =1,n
= 1 + ai b j + ai2 b 2j + K + ain −1b nj −1 = Pi (b j ) , unde
Pi ( x ) = 1 + ai x + a x + K + ain −1 x n −1 . Deci, determinantul cerut este un determinant polinomial cu grad Pi ≤ n − 1 . Avem D = det P ⋅ V (b1 , b2 ,K , bn ) , unde 1 a1 a12 L a1n −1 1 a 2 a 22 L a 2n −1 P= , det P = V (a1 , a 2 ,K, a n ) , deci L L L L L 1 a a 2 L a n −1 n n n 2 i
2
D = V (a1 , a 2 , K, a n ) ⋅ V (b1 , b2 ,K, bn ) . R5.4.9. Să se calculeze valoarea determinantului circular: C (1,2,3, K , n ) . n −1
Soluţie: Avem C (1,2,3,K, n ) = ∏ P(ε i ) , unde ε i ( i = 1, n ) sunt rădăcinile de i =1
ordinul n ale unităţii, iar P( x ) = 1 + 2 x + 3 x + K + nx 2
P(ε i ) =
n −1
(
= 1+ x + x +K+ x 2
n , i = 1, n , εi − 1 126
n
′
)
′ x n +1 − 1 , = x −1
x ≠ 1.
n(n + 1) n(n + 1) P(ε 0 ) = P(1) = . Deci, C (1,2,3, K , n ) = ∏ n −1
2
2
i =1
1 . Fie εi − 1
y i = ε i − 1 , căutăm polinomul cu rădăcinile y i , i = 1, n − 1 . Avem ε i = y i + 1 şi
polinomul în rădăcinile ε i , i = 1, n − 1 este f ( x ) = x n −1 + x n − 2 + K + x + 1 , deci g ( y ) = f ( y + 1) = y n −1 + K + n , deci C (1,2,3,K, n ) = (− 1)
n −1
n n −1 (n + 1) . 2
n −1
∏ y = (− 1)
n −1
i
n şi rezultă
i =1
Probleme rezolvate (5.3)
(
)
R5.6.1. Fie A, B ∈ M 2 (R ) care comută între ele şi det A 2 + B 2 = 0 . Atunci detA = detB. Soluţie: Fie f ( x ) =det(A+xB). Conform teoremei 5.5.1. rezultă că: (1) f ( x ) = det B ⋅ x 2 + ax + det A . Atunci det (A 2 + B 2 ) = det ( A + iB ) ⋅ det ( A − iB ) = f (i ) f (− i ) = 0 , deci, pentru că f are coeficienţi reali, f (i ) = f (− i ) = 0 . Deoarece grad f = 2 ⇒ f(x) = m(x2 + 1). Comparând cu (1) rezultă că detA = detB. R5.6.2. Fie A, B ∈ M 2 (R ) astfel încât det(AB+BA) ≤0. Să se arate că det(A2+B2)≥0. Soluţie: Fie f(x) = det(A2 +B2 +x(AB+BA)). Observăm că f(1)=det(A2 +B2 +AB+BA)=det(A +B)2 ≥0 şi f(-1)=det(A2 +B2 –AB–BA)=det(A–B)2 ≥0. Pe de altă parte, graficul lui f este o parabolă cu maxim deoarece coeficientul lui x2 este det(AB+BA) < 0 . Dacă det(AB+BA)=0, atunci f este liniară. Oricum, din faptul că f (1) ≥ 0 şi f (− 1) ≥ 0 rezultă că f (0 ) ≥ 0 , adică det(A2 +B2)≥0. R5.6.3. Fie A ∈ M 2 (Q ) astfel încât det ( A − 2 I 2 ) = 0 . Să se arate că A 2 = 2I 2 şi det A = −2 . Soluţie: Fie f ( x ) = det ( A − xI 2 ) , având coeficientul x2 egal cu det I 2 = 1 . atunci: det A 2 − 2 I 2 = det A − 2 I 2 det A + 2 I 2 = 0 ⇒ f 2 = f − 2 = 0
(
)
(
) (
127
)
( ) (
)
pentru că f are coeficienţi raţionali. Deci f(x) = α(x2 – 2), α ∈ R . deoarece coeficientul lui x2 este 1, rezultă că α = 1 şi implicit f ( x ) = x 2 − 2 , adică: (2) det ( A − xI 2 ) = x 2 − 2 , (∀)x ∈ R . Pentru x = 0 ⇒ det A = −2 . Cum (2) este ecuaţia caracteristică a lui A, rezultă că A o verifică, deci A 2 − 2 I 2 = O ⇒ A 2 = 2 I 2 . R5.6.4. Fie A, B, C ∈ M n (R ) care comută între ele şi detC=0. Să se arate că det(A2 +B2 +C2)≥0. Soluţie: Fie f(x) = det(A2 +B2 +C2 +xBC). Avem f (− 2 ) = det(A2 +B2 +C2 –2BC)=det(A2 +(B2 -C2))≥0 şi f(2)=det(A2 +B2 +C2 +2BC)=det(A2 +(B2 +C2)) > 0 . Coeficientul lui x2 în dezvoltarea lui f este det(BC)=detBdetC=0, deci f este funcţie liniară. Cum f (− 2 ) şi f(2) sunt pozitive, rezultă că f(0)≥0, adică det(A2 +B2 +C2)≥0. R5.6.5. Fie A şi B două matrice de acelaşi ordin k ( k ∈ N ∗ ). Să se demonstreze că dacă det ( A + nB ) = det (nA + B ) pentru cel puţin k + 1 valori distincte ale numărului natural n > 1 , atunci det A = det B . Soluţie: Fie polinomul f ∈ R[X], f = det(A+xB)–det(xA+B). Acest polinom are gradul cel mult k (având matricele de ordinul k şi ţinând seama produsele care apar în definiţia unui determinant). Cum prin ipoteză f are cel puţin k + 1 rădăcini ⇒ că f este polinomul nul. Făcând x=0 ⇒ f(0) = 0, adică det A = det B . 2π 2π + i sin , n ∈ N*. Arătaţi că: n n det(A+B)+det(A+ ε B) + … + det(A+ ε n −1 B )=n(detA+detB). Soluţie: Fie P(x)=det(A+xB) = a 0 + a1 x + a 2 x 2 + K + a n x n , unde a 0 = det A şi a n = det B . Atunci avem: R5.6.6. Fie A, B ∈ M n (C) şi ε = cos
det(A+B)+det(A+ ε B)+…+ det(A+ ε n −1 B )=f(1)+f( ε ) +.. +f( ε n −1 ) = na 0 + (a1 + a 2 + K + a n −1 ) ⋅
(
)
⋅ 1 + ε + ε 2 + K + ε n −1 + na n = n(a 0 + a n ) = n(det A + det B ) , deoarece
1 + ε + ε 2 + K + ε n −1 = 0 R5.6.7. Să se demonstreze că, (∀)A, B ∈ M n (C) avem: det(In+AB) = det(In+BA).
128
Soluţie: Dacă matricea A este invariabilă, atunci: det(In+AB)=det(In+BA) A −1 =detA·det(In+BA)·det A −1 =det(In+BA). Dacă A este singulară, observăm că matricea z ⋅ I n + A este invariabilă pentru toate numerele complexe z cu excepţia rădăcinilor ecuaţiei det(zIn+A)=0 şi, deci exceptând aceste rădăcini, det(In+(zIn+A)B)=det(In+B(zIn+A)). Întrucât cei doi membri ai egalităţii sunt funcţii polinomiale de z, coincid peste tot şi deci şi pentru z = 0, ceea ce încheie demonstraţia.
129
ANALIZĂ MATEMATICĂ 1. Mulţimi dense Rezultatul de bază este teorema lui Kronecker care joacă un rol important în teoria numerelor. Această teoremă este interesantă şi din alt punct de vedere deoarece cu ajutorul ei se pot rezolva uşor unele probleme dificile cu enunţ elementar. 1.1.1. Definiţie. O mulţime A ⊂ se numeşte densă în dacă orice element din este limita unui şir neconstant cu elemente din A. Facem precizarea că mulţimea A ⊂ este densă în dacă pentru oricare a ∈ şi orice vecinătate V a punctului a, avem V I A este infinită. 1.1.2. Propoziţie. O mulţime A ⊂ este densă în ⇔ orice interval I ⊂ , de lungime nenulă, conţine cel puţin un număr din A. Demonstraţie. “⇒” Presupunem că A este densă în . Trebuie demonstrat că pentru orice a, b ∈ , a < b , există x ∈ A astfel ca a < x < b . Presupunem contrariul. Atunci ∃ α , β ∈ , α < β astfel încât (∀) x ∈ A să avem că x ∉ (α , β ) . (1) β +α Luăm u = , există un şir ( xn ) de ∈ (α , β ) . Cum A este densă în 2 elemente din A astfel încât lim xn = u . De aici rezultă că ∃ n0 ∈ astfel încât n →∞
să avem xn ∈ (α , β ) deoarece (α , β ) este o pentru orice n > n0 , n ∈ vecinătate pentru u. Aceasta este o contradicţie cu presupunerea făcută (1), de aceea obţinem concluzia dorită. “⇐” Fie α ∈ arbitrar. Atunci pentru orice n ∈ * , în intervalul 1 1 α − , α + se găseşte cel puţin un element an ∈ A , conform ipotezei. Cum n n 1 1 α − < an < α + , (∀) n ∈ * , cu teorema cleştelui, se obţine lim an = α . De n →∞ n n . Cu aceasta demonstraţia se unde rezultă că mulţimea A este densă în încheie. 1.1.3. Exemplu. Mulţimea a numerelor raţionale este densă în . Demonstraţie. Fie a, b ∈ , a < b . Atunci există n ∈ astfel ca a + n > 0 . Fie numerele a1 = a + n , b1 = b + n . De aici b1 − a1 = b − a > 0 şi atunci putem găsi un k ∈
*
pentru care k (b1 − a1 ) > 1 ⇔ 1 + k ⋅ a1 < k ⋅ b1 . Fie m 131
cel mai mic număr natural cu proprietatea m > k ⋅ a1 şi deci m − 1 ≤ k ⋅ a1 sau m ≤ 1 + k ⋅ a1 < k ⋅ b1 . În acest mod se obţine m m m k ⋅ a1 < m < k ⋅ b1 ⇔ a1 < < b1 ⇔ a + n < < b + n ⇔ a < − n < b , k k k m cu − n ∈ . k 1.1.4. Exemplu. Mulţimea \ a numerelor iraţionale este densă în . 2 Demonstraţie. Fie α ∈ arbitrar. Dacă α = 0 , atunci există xn = , n (∀) n ≥ 1 de elemente din \ astfel încât lim xn = 0 = α . Dacă α ≠ 0 , atunci n →∞
din faptul că
este densă în
rezultă că există (an ) n ≥0 un şir de numere
raţionale astfel încât lim an = 2 ⋅ α ∈ n →∞
(∀) n ∈ nenulă)
*
. Presupunem în continuare că an ≠ 0 ,
(în caz contrar, avem un număr finit de termeni nuli (limita fiind şi se poate renunţa la aceştia). Luăm şirul (bn ) n≥0 ,
an a 2 ⋅α = 2 ⋅ n ∈ / , (∀) n ∈ şi avem lim bn = 2 ⋅ = α . Aşadar, →∞ n 2 2 2 este limita unui şir de elemente din / , deci / este orice element din densă în . 1.1.5. Exemplu. Demonstraţi că dacă A este densă în iar * r1 ∈ , r2 ∈ , atunci şi mulţimile bn =
A1 = {r1 + a a ∈ A} şi A2 = {r2 ⋅ a a ∈ A}
sunt dense în . Demonstraţie. Fie α ∈ arbitrar. Atunci α − r1 ∈ şi cum A este , rezultă că există un şir ( xn ) n≥0 de elemente din A astfel încât densă în lim xn = α − r1 . De aici rezultă că lim( xn + r1 ) = α şi cum xn + r1 ∈ A , n →∞
n →∞
(∀) n ∈ , va rezulta că A1 este densă în . Analog, pentru β ∈ , arbitrar, există un şir ( yn ) n ≥0 de elemente din A
β
, adică lim(r2 ⋅ yn ) = β şi cum r2 ⋅ yn ∈ A2 , (∀) n ∈ , va n →∞ r2 rezulta că A2 este densă în . 1.1.6. Teoremă. (teorema lui Dirichlet). Dacă α este iraţional şi * p ∈ , atunci există m, n ∈ , 0 < m ≤ p astfel încât astfel încât lim yn = n →∞
132
1 . p Demonstraţie. Împărţim intervalul [0,1] în p intervale egale de lungime 1 1 2 p −1 p, I1 = 0, , I 2 = , ,K , I p = ,1 şi considerăm numerele p p p p x1 = α − [α ] , x2 = 2α − [2α ],K , x p +1 = ( p + 1)α − [( p + 1)α ] . Aceste p + 1
α ⋅m − n ≤
numere se află în intervalul [0,1) ⊂ [0,1] . Cum intervalul [0,1] a fost împărţit în p intervale ca şi mai sus, va rezulta că cel puţin două numere sunt situate în acelaşi interval. Presupunem că acestea sunt kα − [kα ] şi lα − [lα ] cu k , l ∈ {1, 2,K , p + 1} şi k > l . Distanţa dintre ele nu poate depăşi lungimea 1 intervalului în care se află, adică , prin urmare p 1 1 (kα − [kα ]) − (lα − [lα ]) ≤ ⇔ (k − α )l − ([kα ] − [lα ]) ≤ . p p * şi n = [kα ] − [lα ] ∈ . Aceste numere îndeplinesc cerinţele Luăm m = k − l ∈ din concluzia teoremei căci m ≤ p + 1 − 1 = p . 1.1.7. Teoremă. (teorema lui Kronecker). Dacă α este iraţional, atunci mulţimea A = {mα + n m, n ∈ } , este densă în . Demonstraţie. Trebuie să demonstrăm că pentru orice a, b ∈ , a < b , există m1 , n1 ∈ astfel încât a < m1α + n1 < b . Fie a, b ∈ , a < b şi d = b − a 1 ≤ d ( de lungimea intervalului [a, b] . Atunci există p ∈ * astfel încât p 1 exemplu p = + 1 ). Din teorema lui Dirichlet, există m ∈ * şi n ∈ astfel d 1 încât mα − n < ≤ d . Deoarece mα − n este iraţional rezultă imediat că p mα − n ≠ 0 . În continuare vom propune că mα − n > 0 şi a > 0 (analog se va proceda şi în celelalte situaţii). Numerele u, 2u,3u,K , ku,K , u = mα − n , sunt distincte două câte două şi cel puţin unul îl depăşeşte pe a (cel pentru care a k ≥ + 1 ). Demonstrăm că cel mai mic dintre numerele care îl depăşeşte pe u a, fie acesta k1 ⋅ u , aparţine intervalului (a, b). 133
Într-adevăr, din alegerea lui k1 avem (k1 − 1) u ≤ a . Dacă am avea k1 ⋅ u > b , atunci k1u − (k1 − 1) u > b − a = d , în contradicţie cu mα − n < d . Deoarece numărul k1 u = (mk1 )α + (− nk1 ) ∈ (a, b) şi mk1 , − nk1 ∈ , atunci luăm m1 = mk1 , n1 = −nk1 şi avem a < m1α + n1 < b iar teorema este demonstrată. 1.1.8. Observaţie. Se poate demonstra că dacă α ∈ \ , atunci mulţimea B = {mα − n m, n ∈ } , este densă în . 1.1.9. Definiţie. Fie A şi B două mulţimi astfel încât A ⊂ B ⊂ . Se spune că mulţimea A este densă în mulţimea B dacă pentru orice b ∈ B şi pentru orice ε > 0 avem A I (b − ε , b + ε ) ≠ ∅ . 1.1.10. Observaţii. 1) Mulţimea A este densă în mulţimea B dacă pentru orice b ∈ B , una din afirmaţiile următoare este adevărată a) b ∈ A b) b ∉ A dar există un şir (an ) n∈ , an ∈ A , an ≠ b , n ∈ astfel încât lim an = b ; n →∞
2) Facem precizarea că observaţia anterioară este în concordanţă cu definiţia 1.1.1. 1.1.11. Propoziţie. Dacă A ⊂ B ⊂ şi mulţimea A este densă în B, iar este o funcţie continuă, atunci mulţimea f ( A) este densă în f :B→ mulţimea f ( B) . Demonstraţie. Fie y ∈ f ( B) arbitrar. Atunci, există b ∈ B astfel încât y = f (b) . Deoarece f este continuă, pentru ε > 0 există δ > 0 astfel încât f ( x) ∈ ( y − ε , y + ε ) dacă x ∈ (b − δ , b + δ ) I B . Cum A este densă în B, există şi atunci f (a ) ∈ ( y − ε , y + ε ) , deci a ∈ A I (b − δ , b + δ ) f ( A) ∩ ( y − ε , y + ε ) ≠ ∅ şi demonstraţia este încheiată. 1.1.12. Definiţie. Fie C un cerc în planul P şi A ⊂ C o mulţime. Spunem că mulţimea A este densă pe cercul C, dacă pentru orice C ∈ C şi pentru orice ε > 0 avem D (C , ε ) I A ≠ ∅ , unde D (C , ε ) = { X ∈ P d ( X , C ) < ε } reprezintă discul de centru C şi rază ε
din planul P. 1.1.13. Propoziţie. Fie U = z∈
{
}
z = 1 cercul trigonometric ale
cărui puncte le putem privi şi ca numere complexe. Considerăm pe acest cerc un şir de puncte ( An )n ∈ , plasate pe cerc în sens trigonometric şi astfel încât 134
fiecare arc dintre două puncte consecutive Ai şi Ai +1 să aibă aceeaşi lungime a > 0, (l ( Ai Ai +1 ) = a > 0) pentru orice i ∈ . Atunci avem a a) Dacă ∈ atunci şirul ( An )n ∈ este periodic;
π
b) Dacă
a
π
∈
\
atunci mulţimea { An n ∈ } este densă pe cerc, dar
nu există nici un poligon regulat cu vârfurile în mulţimea { An n ∈ } . p ⋅ π , q ∈ * , p ∈ , atunci 2qa = 2 p ⋅ π şi q , adică şirul are perioada 2q.
Demonstraţie. a) Dacă a =
mulţimea Ak = Ak + 2 q , k ∈ c) Dacă
a
π
∈
\
, atunci arătăm că şirul este format din puncte
distincte. Dacă, prin absurd Ak = Ak + m atunci ma = p ⋅ 2π , p ∈ , deci 2p a= ∈ , contradicţie, deci presupunerea făcută este falsă. Pentru orice m 2π ε > 0 există k ∈ * astfel încât < ε . Printre punctele A1 , A2 ,K , Ak există k 2π două puncte pentru care l ( Ai , Aj ) ≤ 0, ∃ m, n ∈ , m ≠ 0 astfel încât α m − n < ε . Soluţie. Cum ε > 0 , există p ∈
1 p = + 1∈ ε
*
*
1 < ε (de exemplu p
astfel încât
) . Atunci , din teorema lui Dirichlet, există m ∈
0 < m ≤ p , astfel încât α m − n
0 , există m, n ∈ astfel încât 1 1 1 π 2n + − ε < π 2 2m + < π + 2n + ε ⇔ 2 2 2 1 ε 1 1 ε ⇔ 2n + − < 2 2m + < + 2n + ⇔ 2 π 2 2 π 1 2ε 1 2ε ⇔ 1 − 2 − < m 2 − n < 1 − 2 + . π π 4 4 (2) Deoarece mulţimea A = m 2 − n m, n ∈ este densă în , existenţa lui
{
m, n ∈ m, n ∈
}
care verifică (2) este asigurată. Relaţia (2) ne dă faptul că găsim 1 astfel încât numărul 2 2m + să se apropie oricât de mult de 2
1 . Utilizând acum relaţia (1) şi continuitatea funcţiei sin x , deducem că f 2 ia valori oricât de apropiate de 2. R1.2.4. Fie a∈ \ . Demonstraţi că funcţia f: → , f ( x) = sin x + cos ax , (∀) x ∈ nu este periodică. Soluţie. Să presupunem prin absurd că există T > 0 astfel încât f ( x + T ) = f ( x) , (∀) x ∈ ⇔ sin( x + T ) + cos a ( x + T ) = sin x + cos ax , (∀) x ∈ . Punând x = 2mπ , m ∈ în relaţia anterioară, obţinem sin T + cos a(2mπ + T ) = cos a(2mπ ) , (∀) m ∈ ⇒ 2nπ ⇒ sin T + cos a 2mπ + + T = cos a (2mπ + 2nπ ) , (∀) m, n ∈ . a 1 Cum a ∈ \ ⇒ ∈ \ şi din teorema lui Kronecker, şi Exemplul 1.1.5 a 1 rezultă că mulţimea A = 2π m + ⋅ n m, n ∈ este densă în . Obţinem a atunci că sin T + cos a ( x + T ) = cos ax , (∀) x ∈ . Pentru x = 0 şi respectiv x = −T în ultima egalitate, obţinem 2n +
138
T ∈ {kπ k ∈ } sin T + cos aT = 1 sin T = 0 ⇒ ⇒ sin T − cos aT = −1 cos aT = 1 aT ∈ {2 sπ s ∈ },
a ⋅ T 2 sπ 2s = = ∈ , absurd. T kπ k R1.2.5. Fie a ∈ . Să se determine toate funcţiile continue f :
deci a =
→
pentru
b
care
∫ f ( x) dx = e
b
− e a , (∀) b ∈
.
a
x
Soluţie. Fie funcţiile g , h :
→
, g ( x) = ∫ f (t ) dt , h( x) = e x − e a , a
(∀) x ∈ . Deoarece f este continuă pe , g este continuă pe (este chiar derivabilă pe ) şi evident h este continuă pe . În plus, g ( x) = h( x) , (∀) x ∈ , de unde, utilizând problema R.1.2.1 şi faptul că mulţimea este densă în rezultă că g ( x) = h( x) , (∀) x ∈ . Deci x
∫ f ( x) dx = e
x
− e a , (∀) x ∈
,
a
de unde, prin derivare, deducem că f ( x) = e x , (∀) x ∈ , funcţie care verifică condiţiile din ipoteză. R1.2.6. Fie a ∈ [0,1] şi ε > 0 . Demonstraţi că există o infinitate de numere naturale n pentru care sin n − a < ε . Soluţie. Din a ∈ [0,1] ⇒ (∃) α ∈ [0, π ] astfel încât a = sin α . Atunci
avem sin n − a = sin n − sin α = sin n − sin(α + 2kπ ) =
= 2 sin (1)
n − α − 2kπ n + α + 2kπ n − α − 2kπ ⋅ cos ≤ 2 sin ≤ n − α − 2kπ 2 2 2
Din teorema lui Kronecker, mulţimea A = {−2π ⋅ k + n n, k ∈
densă în
}
este
, ca urmare, există o infinitate de numere naturale n, k astfel încât α − ε < n − 2kπ < α + ε ⇔ n − 2kπ − α < ε ,
de unde, utilizând şi (1) rezultă concluzia problemei. R1.2.7. Fie (an ) n ≥0 un şir de numere reale diferite de zero, astfel încât lim an = 0 . Atunci mulţimea A = {m ⋅ an m ∈ , n ∈ n →∞
139
} este densă în
.
Soluţie. Fie α ∈ , α > 0 . Deoarece lim an = 0 , rezultă că există n →∞
, astfel încât an < α , (∀) n ∈ , n ≥ n0 . Fie n ≥ n0 . Cum şirul de termen 1 general bm = , m ∈ * , converge la zero, există m′ ∈ * astfel încât m a 1 ≤ n < 1 . Fie m′′ cel mai mic număr natural cu această proprietate. m′ α Notând mn = m′′ dacă an > 0 şi mn = − m′′ dacă an < 0 , avem n0 ∈
0 ≤ mn ⋅ an − α < an , pentru orice n ≥ n0 .
(1) Luând mn = 1 pentru n < n0 , n ∈
*
, obţinem astfel şirul (mn an ) n≥0 de elemente
din A care, în baza relaţiei (1) converge la α. Dacă α < 0 , atunci, ca şi mai sus, rezultă că există un şir (mn an ) n≥0 de elemente din A care converge la − α şi deci şirul (− mn an ) n≥0 , care conţine tot elemente din A, va converge la α. Dacă α = 0 , atunci şirul (an ) n ≥0 , an ∈ A , converge către α = 0 . În concluzie, mulţimea A este densă în . 1 Observaţie. Luând în problema 6 pe an = , (∀) n ∈ * , va rezulta că n şi deci este densă în . mulţimea A este chiar mulţimea
{
} este densă în
R1.2.8. Mulţimea A = m 3 + n 2 m, n ∈
.
3 6 = este iraţional şi din teorema lui Kronecker 2 2 3 . Fie α ∈ + n m, n ∈ este densă în rezultă că mulţimea B = m 2 Soluţie. Numărul
arbitrar. Atunci există un şir de termen general xk = mk ⋅
α
3 + nk , k ∈ 2
, format
, deci şirul de termen general 2 2 ⋅ xk , care este un şir de elemente din A converge către α. Prin urmare, mulţimea A este densă în . R1.2.9. a) Să se arate că mulţimea n m n, m ∈ , n > 1 este densă în [1, ∞) . cu elemente din B, care converge către
{
}
140
{
b) Ce se poate spune, din acest punct de vedere, despre mulţimea p q p, q numere prime ?
}
Soluţie. a) Avem lim n 1 = 1 . Dacă a > 1 , pentru orice n ∈ n →∞
m∈
astfel
încât
m ≤ an < m + 1 ,
deci
n
m ≤ a < n m +1 .
, există Deoarece
( )
1 → 0 deducem că şirul n m are limita a (a arbitrar în n≥2 n (1, ∞) ). Aşadar, mulţimea din enunţ este densă în [1, ∞) . b) Dacă n = p este număr prim şi a > 1 , există m ∈ astfel încât n
m +1 − n m
0 . Funcţia f ( x) = qx 2 , pentru x ∈ 0, , q q m m f x + = f ( x) + , pentru m ∈ q q
este continuă, satisface condiţiile 141
f ( x + 1) = f ( x) + 1 şi f ( x + α ) = f ( x) + α . Această funcţie nu este, însă, de forma f ( x) = x + c cu c ∈ . R1.2.11. Să se arate că şirurile (sin n) n∈
*
şi (cos n) n∈
*
sunt dense în [−1,1] .
Soluţia I. Mulţimea A = {n + m ⋅ 2π n ∈ , m ∈
}
este densă în
deoarece 2π ∈ \ . Considerând funcţiile continue f = sin : → [−1,1] şi g = cos : → [−1,1] , rezultă în conformitate cu Propoziţia 1.1.11 că mulţimile f ( A) şi g ( A) sunt dense în f ( ) = g ( ) = [−1,1] . Dar f ( A) = {sin(n + m ⋅ 2π ) n ∈ , m ∈
} = {sin n n ∈ } şi } = {cos n n ∈ }
g ( A) = {cos(n + m ⋅ 2π ) n ∈ , m ∈
şi soluţia problemei se încheie. Soluţia II. Fie z = cos1 + i sin1∈ U , un număr complex de pe cercul de rază 1 din planul complex. Şirul ( z n ) n∈ * determină un şir de afixe ( An ) n∈ * de pe acest cerc astfel încât l = ( An An +1 ) = 1 . Conform Propoziţie 1.1.13 şirul ( An ) n∈ * formează o mulţime densă pe cerc. Această mulţime densă se proiectează pe diametrele de pe axele Ox şi Oy în mulţimi dense. Proiecţiile pe Ox sunt punctele Bn de abscisă cos n , iar proiecţiile pe Oy sunt punctele Cn de ordonată sin n dense fiecare în [−1,1] . R1.2.12. Fie şirul (bn ) n ≥1 , bn = sin 1 3 mulţimea {cn n ∈
π α
1
+ sin
π α
2
+ K + sin
α ∈ ,1 iar cn = {bn } partea zecimală a lui bn, n ∈
Soluţie.
*
π α
n
*
, unde n ∈
*
şi
. Să se arate că
} este densă în [0,1].
Vom arăta că şirul (an ) n∈
verifică condiţiile din Propoziţia 1.1.14. π Avem: lim sin α = 0 (pentru α > 0 ); n →∞ n x3 Din inegalitatea sin x > x − , x > 0 rezultă că 6 3 1 π π π sin α > α − ⋅ 3α 6 k k k
142
*
,
π an = sin α k
(1)
,n ∈
*
k = 1, n
Deoarece
α ≤1
şirul
π π π α + α +K + α n n∈ 1 2
este
divergent
cu
*
π 1 π π şi cum lim α + α + K + α = +∞ α> obţinem că şirul n →∞ 1 2 3 n 1 1 1 3α + 3α + K + 3α * este convergent. Folosind acum inegalitatea (1) şi 2 n n∈ 1 însumând pentru k = 1, n , găsim că lim bn = +∞ . Utilizând acum Propoziţia n →∞
1.1.14, rezultă concluzia problemei. R1.2.13. Să se arate că există n ∈ astfel încât primele patru cifre ale n numărului 2 să fie 2002. Soluţie. Condiţia ca primele patru cifre ale lui 2n să fie 2002 este 2002 ⋅10k ≤ 2n < 2003 ⋅10k ⇔ k + lg 2002 ≤ n lg 2 < k + lg 2003 ⇔ ⇔ lg 2002 ≤ n lg 2 − k < lg 2003 . Deoarece lg 2 ∉ (se arată prin
{n lg 2 − k k ∈
,n∈
}
este densă în
[lg 2002,lg 2003) . Aşadar, există n ∈
reducere
la
absurd),
mulţimea
, va rezulta că ea are elemente şi în cu proprietatea cerută.
143
2. Subşir. Şir fundamental. Criterii de convergenţă 2.1. Subşir al unui şir În acest paragraf vom defini noţiunea de subşir al unui şir şi vom prezenta câteva teoreme referitoare la subşiruri. 2.1.1. Definiţie Fiind dat şirul (xn)n≥1 şi un şir de numere naturale (nk ) k ≥1 strict crescător, atunci şirul ( xn ) k ≥1 se numeşte subşir al şirului ( xn ) n≥1 . k
2.1.2. Exemplu
Şirul xn =
−1 (−1) n 1 admite subşirurile x2 n = şi x2 n+1 = . 2n n 2n + 1
2.1.3. Observaţii i) Dacă şirul (xn)n≥1 este crescător (descrescător) atunci orice subşir al său este crescător (descrescător) ii) Dacă şirul (xn)n≥1 este mărginit superior (inferior), atunci orice subşir al său este mărginit superior (inferior). 2.1.4. Teoremă
Fie (xn)n∈N un şir de numere reale care are limita x ∈ R . Atunci orice subşir al său are limita x Demonstraţie. Fie ( xn ) k ≥1 un subşir fixat al şirului (xn)n≥1 şi fie V∈V(x). Atunci k ∃ N∈N* astfel încât xn∈V, (∀) n≥N. Fie k0 cel mai mic număr natural cu proprietatea nk0 ≥ N. Atunci ∀ k≥k0: xnk ∈ V. Prin urmare lim xnk = x . k →∞
2.1.5. Observaţii Din teorema 2.1.4. decurge imediat că: a) Dacă un şir conţine cel puţin un subşir divergent, atunci el este divergent b) Dacă un şir conţine (cel puţin) două subşiruri convergente către limite diferite atunci el este divergent.
144
2.1.6. Exemplu 1 n Şirul xn = + (− 1) ⋅ 2 este divergent. Într-adevăr, considerând subşirurile n 1 1 x2 n = + 2 şi x2 n+1 = − 2 avem că lim x2 n = 2 şi lim x2 n+1 = 2 n→∞ n→∞ 2n 2n + 1 2.1.7. Teoremă (Lema lui Cesaro). Orice şir mărginit din R posedă un subşir convergent. Demonstraţie: Fie (xn)n≥1 un şir mărginit de numere reale. Atunci există un
interval I1=[a,b] ⊆ R astfel încât xn∈ I1, ∀ n≥1. Fie c =
a+b . Cel puţin unul 2
din intervalele [a,c] sau [c,b] conţine o infinitate de termeni ai şirului (xn)n≥1 şi îl vom nota cu I2. Continuăm procedeul împărţind intervalul I2 în două părţi egale şi observăm că cel puţin unul din intervalele formate, notat cu I3, are o infinitate de termeni ai şirului (xn)n≥1 ş.a.m.d. Am construit astfel un şir de intervale Ik = [ak,bk], bk – ak= 1,
b−a . Considerăm xn1 ∈ I1 , xn2 ∈ I 2 , … , xnk ∈ I k cu nk >nk2 k −1
… un subşir al şirului (xn)n≥1.
Întrucât Ik ⊇ Ik+1 obţinem: a1 ≤ a2 ≤ … ≤ an ≤ … ≤ b1 ≤ … ≤ b1, de unde şirurile (an)n≥1 şi (bn)n≥1 sunt monotone şi mărginite, şi deci conform teoremei lui Weierstrass convergente. Fie lim an = a şi lim bn = b . Evident, a ≤ b, dar 0 ≤ n→∞
n→∞
b-a ≤ bn-an → 0 (n → ∞), deci b= a. Întrucât ak ≤ xnk ≤ bk obţinem prin trecere
( )
la limită, aplicând criteriul cleştelui, că subşirul xnk lim xnk = a = b. k →∞
145
k ≥1
este convergent şi
2.1.8. Observaţii: a) Orice şir nemărginit superior conţine un subşir care are limita + ∞. b) Orice şir nemărginit inferior conţine un subşir care are limita – ∞.
Următoarea teoremă ne ajută să stabilim convergenţa unui şir studiind subşirurile sale: 2.1.9. Teoremă: Fie (xn)n≥1 un şir de numere reale cu proprietatea că subşirurile (x2n)n≥1 şi (x2n+1)n ≥1 au aceeaşi limită. Atunci şirul (xn)n≥1 are limită şi lim x n = lim x 2 n = lim x 2 n +1 . n →∞
n →∞
n →∞
Demonstraţie: Vom analiza cazul: lim x2 n = lim x2 n +1 = a ∈ R . Fie ε>0. Atunci n →∞
n →∞
rezultă că ∃ nε′ ∈ N astfel încât |x2n-a| 0 ∃ nε ∈ N* astfel încât |xn+p – xn| < ε, (∀) p∈N* şi n ≥ nε. (2.2.2) 2.2.3. Exemple: 1 Şirul x n = este şir Cauchy. n2 Într-adevăr, fie ε > 0 fixat. Atunci: 1 1 1 1 1 1 2 |xm – xn| = 2 − 2 ≤ 2 + 2 ≤ + < ε , (∀) m,n ≥ nε, unde nε = + 1 m n m n m n ε 2.2.4. Teoremă (Cauchy) Fie (xn)n≥1 un şir cu elemente din R. Atunci (xn)n≥1 este convergent dacă şi numai dacă este fundamental. Demonstraţie: Necesitatea Presupunem că şirul (xn)n≥1 este convergent şi fie l = lim xn şi ε > 0 fixat. n →∞
Atunci (∃) nε ∈ N* astfel încât xn − l
0 există n1∈N* astfel încât xn − xn1 < 1 , (∀) n ≥ n1, adică xn ≤ xn − xn1 + xn1 < 1 + xn1 = a , (∀) n ≥ n1 . Luând A = max {a, x1 , x2 , … , xn1 } obţinem xn ≤ A, (∀) n∈N*, deci şirul ( xn ) n≥1 este mărginit. Din Lema lui Cesaro (T. 2.1.7), şirul ( xn ) n≥1 conţine un subşir convergent ( xnk ) k ≥1 . Fie x = lim xnk şi ε > 0 fixat. Atunci (∃) kε ≥ 1 astfel încât k →∞
x nk − x
0, întrucât şirul ( xn ) n≥1 este fundamental, (∃) nε ≥ 1 astfel încât xm − xn
0 , ∀ n ≥ n1, deci şirul ( xn ) n≥1 este strict crescător. Din teorema lui Weierstrass xn → x unde x ∈ R sau x = +∞. Presupunând că x ∈ R atunci lim( xn+1 − xn ) = 0 contradicţie. Deci x = lim xn = +∞. n →∞
n →∞
(ii) analog. 2.3.2. Observaţie: Teorema anterioară nu dă nici o indicaţie asupra naturii şirului ( xn ) n≥1 dacă lim( xn+1 − xn ) = 0 . În acest caz putem avea: n →∞
n n →∞ n +1 (ii) lim xn = +∞ , de exemplu xn = n
(i) lim xn ∈ R , de exemplu xn = n →∞
(iii) lim xn = −∞ , de exemplu xn = − n . n →∞
149
2.3.3. Teoremă (Criteriul raportului) Fie ( xn ) n≥1 un şir de numere reale strict pozitive pentru care există x lim n+1 = λ ∈ [0,+∞]. n →∞ x n (i) Dacă λ ∈ [0,1) atunci şirul ( xn ) n≥1 este convergent şi lim xn = 0. n →∞
(ii)
Dacă λ ∈ (1,+∞] atunci lim xn = +∞. n →∞
Demonstraţie: i)
Fie V ∈ V(λ), 1 ∉ V. Atunci există n1 ∈ N * astfel încât
xn+1 ∈ V, xn
xn+1 < 1 , deci şirul ( xn ) n≥1 este strict pozitiv xn şi mărginit inferior de zero. Conform teoremei lui Weierstrass rezultă că este convergent, adică lim xn = x ∈ [0,∞). Dacă a > 0 (∀) n ≥ n1. Avem aşadar
n →∞
xn+1 = 1 contradicţie, deci lim xn = 0. n →∞ n →∞ x n Analog cu punctul (i).
atunci lim ii)
2.3.4. Observaţie: Teorema anterioară nu dă nici o indicaţie asupra naturii şirului ( xn ) n≥1 dacă x lim n+1 = 1 . În acest caz putem avea: n →∞ x n 1 i) lim xn ≠ 0, de exemplu xn = 1+ n →∞ n 1 ii) lim xn = 0, de exemplu xn = n →∞ n iii) lim xn = +∞, de exemplu xn = n n →∞
Adăugând însă o condiţie suplimentară asupra şirului ( xn ) n≥1 , se poate da următorul rezultat care asigură convergenţa spre zero a şirului ( xn ) n≥1 . 2.3.5. Teoremă [5] Fie ( xn ) n≥1 un şir convergent de numere reale nenule astfel încât există x lim n n − 1 ∈ R * . Atunci lim xn = 0. n →∞ n →∞ xn −1
150
Demonstraţie: Fie ( z n ) n≥1 şirul de numere reale cu proprietatea că: z1 + z 2 + ... + z n = xn , pentru orice n ≥ 1 (2.3.1) n z1 + z 2 + ... + z n = nxn Avem de aici ,n>1 z1 + z 2 + ... + z n−1 = (n − 1) xn−1 De unde deducem relaţia z n = nxn − (n − 1) xn−1 , n > 1 care se poate scrie sub x forma echivalentă z n = xn−1 n n − 1 + 1 . Din această relaţie, pe baza xn−1 ipotezelor, rezultă că şirul ( z n ) n≥1 are limită finită. Pe de altă parte, din lema lui Cesaro-Stolz (vezi teorema 2.4.3) rezultă că: z + z + ... + zn = lim zn +1 = lim zn şi ţinând seama de (2.3.1) obţinem lim 1 2 n→∞ n→∞ n→∞ n lim xn = lim z n = L ∈ R . n →∞
n →∞
x Notând lim n n − 1 = l ∈ R * , din relaţia (2.3.1) obţinem L = L ( l + 1 ) şi cum n →∞ xn −1 l ≠ 0 rezultă că L = 0.
2.3.6. Observaţii: x a) Dacă lim n n − 1 = 0 , concluzia teoremei nu mai are loc. n →∞ xn−1 x 1 Într-adevăr, considerând şirul xn = 1 + , avem lim xn = 1 şi lim n n − 1 = 0 . n →∞ n →∞ n xn−1 x b) Dacă lim n n − 1 = +∞ atunci lim xn = +∞. n →∞ n→∞ xn−1
x Într-adevăr, fie ε > 0 fixat. Atunci există nε ∈ N * astfel încât n n − 1 > ε , xn−1 (∀) n ≥ nε. x ε De aici obţinem: n > 1 + , (∀) n ≥ nε şi prin înmulţiri succesive avem: xn−1 n
xn ε > 1 + xnε − 1 nε
ε ε ⋅ 1 + ⋅ ... ⋅ 1 + n nε + 1 de unde deducem că:
151
1 ε ε ε 1 ⋅ ... ⋅ 1 + > xnε − 1 ⋅ 1 + ε + ... + şi xn ≥ xnε − 1 ⋅ 1 + ⋅ 1 + n n nε nε nε + 1 1 1 1 cum lim + + ... + = +∞ obţinem lim xn = +∞. n →∞ n →∞ n n ε nε + 1 x c) Condiţia ca lim n n − 1 ∈ R * nu atrage după sine convergenţa şirului n →∞ xn−1 ( xn ) n≥1 . x Într-adevăr luând xn = n 2 avem lim xn = +∞ şi lim n n − 1 = 2 n →∞ n →∞ xn−1
2.3.7. Exemple Să se determine limita şirurilor:
αn
, (α > 1) n! (2n)! b) xn = n n 2n c) xn = n C2 n 1 ⋅ 3 ⋅ 5 ⋅ ... ⋅ (2n − 1) ,n ≥1 d) an = 2 ⋅ 4 ⋅ 6 ⋅ ... ⋅ 2n a ⋅ (a + 1) ⋅ ... ⋅ (a + n + 1) e) bn = , a ∈ [0,1), n ≥ 1 n! Soluţii Avem x α a) n+1 = → 0 , deci conform criteriului raportului lim xn = 0. n →∞ xn n +1 x 2(2n + 1) b) n +1 = → ∞ , deci lim xn = +∞. n n →∞ xn 1 1 + n x n +1 1 c) n +1 = → , deci lim xn = 0. n →∞ xn 2n + 1 2 a) xn =
152
an 2n − 1 = < 1 , deci şirul (an ) n≥1 este monoton 2n an−1 descrescător şi mărginit inferior, ca urmare este convergent. Întrucât a 1 lim n n − 1 = − , conform teoremei 2.3.3 lim an = 0 . n →∞ n →∞ 2 an −1 b a + n −1 e) Avem 0 < bn şi n = < 1 , deci şirul (bn ) n≥1 este monoton bn −1 n descrescător şi mărginit inferior, ca urmare este convergent. Întrucât b lim n n − 1 = a − 1∈ R* , rezultă lim bn = 0 n →∞ n →∞ bn −1
d) Avem 0 < an < 1 şi
2.4. Criteriul lui Cesaro-Stolz
0 ) 0 şi ( y n ) n≥1 două şiruri cu următoarele proprietăţi:
2.4.1. Teoremă (Cesaro-Stolz, cazul
Fie ( xn ) n≥1
(i) lim xn = lim y n = 0; y n ≠ 0 , n ∈ N * n →∞
n →∞
(ii) şirul ( y n ) n≥1 este strict descrescător x −x (iii) există lim n+1 n = l ∈ R n →∞ y n +1 − y n
x x Atunci şirul n are limită şi lim n = l → ∞ n yn y n n≥1 Demonstraţie: Avem trei cazuri posibile l ∈ R, l = +∞ sau l = –∞. Cazul I: l ∈ R. Fie ε > 0. Atunci există nε ∈ N * astfel încât x −x l − ε < n+1 n < l + ε , (∀)n ≥ nε . y n+1 − y n Deoarece y n+1 − y n < 0 , n ∈ N * , inegalitatea devine: (l + ε )( y n+1 − y n ) < xn+1 − xn < (l − ε )( y n+1 − y n ) . Însumând aceste inegalităţi pentru n = m, m + p − 1, m ≥ nε şi p ∈ N * obţinem: (l + ε )( y m+ p − y m ) < xm+ p − xm < (l − ε )( y m+ p − y m )
153
Pentru m ≥ nε şi p → ∞ , ţinând seama că lim xm+ p = lim y m+ p = 0 se obţine: p →∞
p →∞
(l + ε )(− y m ) < − xm < (l − ε )(− y m ) , m ≥ nε. Deci
xn xm =l. − l < ε , (∀) m ≥ nε ceea ce înseamnă că mlim →∞ y ym m
Cazul II: l = +∞. Fie ε > 0, atunci există nε ∈ N * astfel încât:
xn+1 − xn > ε , (∀) y n+1 − y n
n ≥ nε.. Deoarece y n−1 − y n < 0 , n ∈ N * inegalitatea devine: xn+1 − xn < ε ( y n+1 − y n ) , n ≥ nε. Însumând aceste inegalităţi pentru n = m, m + p − 1, m ≥ nε , m ≥ nε şi p ∈ N * obţinem: xm+ p − xm < ε ( y m+ p − y m ). Pentru m ≥ nε şi p → ∞ ţinând seama că lim xm+ p = lim y m+ p = 0 , se obţine p →∞
p →∞
xm x > ε , (∀)m ≥ nε , ceea ce înseamnă că lim m = +∞ . m→∞ y ym m Cazul III: l = –∞. Analog cazului II. 2.4.2. Exemplu:
1 1 1 + 2 + ... + 2 , ∀ n ∈ N*. Admitem cunoscut că 2 n 1 2 2 π π2 . . Să se calculeze lim n a n − lim a n = n →∞ n →∞ 6 6
Se consideră şirul an =
π Soluţie: n a n − 6
2
=
an −
π2
6 . 1 n 1 π2 Fie x n = a n − şi y n = . Avem lim xn = 0, lim y n = 0 , ( y n ) n≥1 strict n →∞ n →∞ 6 n 1 x −x −n (n + 1) 2 descrescător şi lim n +1 n = lim = lim = −1 . n →∞ y n →∞ 1 1 n →∞ n + 1 n +1 − y n − n +1 n
154
π2 = −1 . Aplicând teorema 2.4.1 obţinem că lim n a n − n →∞ 6
∞ ) ∞ două şiruri care au următoarele proprietăţi:
2.4.3. Teoremă (Cesaro-Stolz, cazul
Fie ( xn ) n≥1 şi ( y n ) n≥1
(i) y n > 0 , n ∈ N * , ( y n ) n≥1 strict crescător şi nemărginit x −x (ii) există lim n+1 n = l ∈ R . n →∞ y n +1 − y n
x x Atunci şirul n are limită şi lim n = l . → ∞ n yn y n n≥1 Demonstraţie: Avem trei cazuri posibile: l ∈ R , l = +∞ sau l = −∞ . Vom considera doar cazul l = +∞ , celelalte două cazuri demonstrându-le analog. Fie ε > 0. Atunci există mε ∈N* astfel încât z n − l < not
zn =
2
, (∀) n ≥ mε, unde
xn+1 − xn . Fie m ≥ mε şi p ∈ N * . Se observă că: y n+1 − y n
xm+ p = xm +
m + p −1
m + p −1
k =m
k =m
∑ ( yk +1 − yk ) z k = xm + l ( ym+ p − ym ) +
Împărţind prin y m+ p se obţine
vp =
ε
1
y m+ p
m + p −1
∑( y
k =m
k +1
xm+ p y m+ p
∑( y
k +1
− y k )( z k − l )
− l = u p + v p , unde u p =
xm − ly m şi y m+ p
− y k )( z k − l ) .
Se observă că lim u p = 0 , deci există pε ∈ N * astfel încât u p < p →∞
vp ≤
ε 2 y m+ p
1
y m+ p
m + p −1
∑( y
k =m
k +1
− yk ) z k − l ≤
y ε ( y m + p − y m ) = 1 − m 2 y m+ p
ε
m + p −1
2 y m+ p
k =m
∑( y
ε < . 2
155
k +1
− yk ) =
ε 2
, (∀) p ≥ pε .
Deci v p
0 , a > 1 . 2.5.6. Observaţie Nu întotdeauna două şiruri sunt comparabile prin intermediul acestui concept de ordin de convergenţă. 1 1 Într-adevăr, pentru şirurile an = sin n , n ≥ 1 şi bn = , n ≥ 1 avem an → 0 şi n n an bn → 0 când n → ∞ , dar lim nu există. Rezultatul obţinut exprimă n→∞ b n diferenţa esenţială care există între comportamentul acestor două şiruri în procesul de „apropiere” de limita lor comună, zero. Şirul lui e
Reamintim fără demonstraţie următorul rezultat:
160
2.5.7. Teoremă [1] n
1 Fie en = 1 + , n ≥ 1 . Atunci şirul ( xn ) n≥1 este strict crescător şi mărginit, n deci convergent. Limita sa se notează cu e şi avem 2 < e < 3 . 2.5.8. Corolar [1] n
1 Şirul 1 + , n ≥ 1 este strict crescător, iar şirul n descrescător şi avem inegalităţile: n
1 1 1 + < e < 1 + n n
1 1 + n
n +1
este strict
n +1
, (∀)n ≥ 1
2.5.9. Observaţie i) Se arată că numărul e (iniţiala de la Euler) este transcendent şi avem e = 2,7182818… ii) Utilizând procedeele de calcul diferenţial se arată că cel mai mic număr β şi cel mai mare număr α astfel încât pentru orice n ∈ N * să aibă loc inegalitatea:
1 1 + n
n +α
1 ≤ e ≤ 1 + n
n+ β
sunt α =
1 1 − 1 şi β = . ln 2 2
2.5.10. Teoremă [1]
i) Dacă (an ) n≥1 este un şir cu proprietatea că lim a n = +∞ atunci n→∞
an
1 lim 1 + = e n→∞ an ii) Dacă (bn ) n≥1 este un şir convergent la 0 atunci: lim (1 + bn ) n→∞
1 bn
=e
2.5.11. Observaţie Are loc inegalitatea: n
e e 1 < e − 1 − < 2n + 2 2n + 1 n
161
Această inegalitate precizează ordinul de convergenţă al şirului (en ) n≥1 către 1 n e limita sa, numărul e, în sensul că lim n e − 1 + = , deci şirul (en ) n≥1 n→∞ n 2
1 converge către e la fel de repede ca şirul către zero. O demonstraţie n n≥1 elementară a acestei inegalităţi se găseşte în [2].
2.5.12. Teoremă [1]
1 1 1 Şirul ( En ) n≥1 , E n = 1 + + + ... + este strict crescător şi are limita e. 1! 2! n! Constanta lui Euler 2.5.13. Teoremă 1 1 Fie cn = 1 + + ... + − ln n , n ≥ 1 . Atunci şirul (cn ) n≥1 este strict descrescător n 2 şi minorat de 0, deci convergent. Limita sa, numită constanta lui Euler se notează cu c şi 0 < c < 1 . n
n +1
1 1 Demonstraţie: Logaritmând inegalitatea 1 + < e < 1 + , obţinem: n n n n 1 1 1 1 < ln(n + 1) − ln n < , ∀n ≥ 1 şi deci ∑ < ln(n + 1) < ∑ , ∀n ≥ 1 n +1 n k =1 k + 1 k =1 k 1 1 1 Atunci avem: cn+1 − cn = − ln(n + 1) + ln n = − ln1 + < 0 , deci şirul n +1 n +1 n n 1 (cn ) n≥1 este strict descrescător şi 0 < ln(n + 1) − ln(n) < ∑ − ln n = cn < c1 = 1 k =1 k Aşadar (cn ) n≥1 este strict descrescător şi minorat de 0, deci convergent. Fie c limita sa. Evident 0 < c < 1 2.5.14. Observaţie i) c = 0,5772156619... Nu se cunoaşte dacă c este raţional, iraţional, algebric sau transcendent. 1 1 ii) Are loc inegalitatea < cn − c < 2n + 1 2n
162
Demonstraţia acestor inegalităţi se face astfel: n+
1
1 2 Din inegalitatea: e < 1 + (vezi Observaţia 2.5.9 ii) prin logaritmare se n 2 < ln(n + 1) − ln n (1) obţine 2n + 1 n
e 1 Din inegalitatea: < e − 1 + (vezi Observaţia 2.5.11) se obţine 2n + 2 n n
2n + 1 2n + 1 1 , de unde prin logaritmare avem ln(n + 1) − ln n < 1 + < e ⋅ 2n + 2 2n(n + 1) n (2) Deci din (1) şi (2) avem: 2 2n + 1 < ln(n + 1) − ln(n) < (3) 2n + 1 2n(n + 1) 1 1 şi vn = cn − . Fie şirurile (un ) n≥1 şi (vn ) n≥1 definite prin u n = cn − 2n + 1 2n Folosind inegalităţile (3) se arată că şirul (un ) n≥1 este strict descrescător, iar (vn ) n≥1 este strict crescător. Observând că lim u n = lim v n = c avem: n→∞
n→∞
1 1 1 1 cn − < cn − c < < c < cn − , de unde obţinem . 2n + 1 2n 2n 2n + 1 Această inegalitate stabileşte ordinul de convergenţă al şirului (cn) în sensul că: 1 lim n (c n − c ) = , deci şirul (cn ) n≥1 convergent către c are acelaşi ordin de n→∞ 2 1 convergenţă cu şirul , altfel spus, şirul (cn ) n≥1 converge către c la fel de n n>1 1 repede ca şirul către 0. n n>1 1 1 1 iii) lim + + ... + = ln k , ∀k ≥ 2 . n→∞ n + 1 n+2 kn Într-adevăr, trecând la limită în egalitatea: 1 1 1 1 1 1 1 + + ... + = 1 + + ... + − ln kn – 1 + + ... + − ln n + ln k se n kn n +1 n + 2 kn 2 2 obţine rezultatul dorit.
163
2.5.15. Problemă rezolvată: 1 ∑1 ∑ k k k =1 k =1 Să se calculeze lim e −e n→∞ n +1
n +1
Rezolvare: Fie a n = e e Cn ⋅
e
1 n +1
−1
1 n
n
k =1
n
1
∑k
−e
1
∑k k =1
n
1
∑k 1 n1+1 cn n +1 k =1 = e e − 1 = e ⋅ n e − 1 =
. Trecând la limită obţinem lim a n = e c n→∞
Şirul lui Lalescu. Generalizări 2.5.16. Exerciţiu rezolvat Să se arate că 1 lim n +1 ( n + 1)! − n n! = (Traian Lalescu – GM 1901) n→∞ e Rezolvare: Calculăm mai întâi n +1 ( n + 1)! n +1 ( n + 1)! n +1 n 1 n lim n = lim ⋅ ⋅ n = ⋅1 ⋅ e = 1 deoarece lim n = e n n n→∞ → ∞ → ∞ n +1 n n e n! n! (utilizând Criteriul lui Cesaro-Stolz) n +1 (n + 1)! n − 1 = n !(ebn − 1) , unde Deci a n = n +1 (n + 1)! − n n! = n n ! n n! n +1 ( n + 1)! 1 1 bn = ln n = ln(n + 1)!− ln n! , n ∈ N * şi bn → 0 . n +1 n n!
(
)
n! e bn − 1 1 ⋅n⋅ ⋅ bn → ⋅1⋅ lim nbn n bn e n →∞ n ln(n + 1)!−(n + 1) ln n! n ln(n + 1) − ln n! u n Însă nbn = = , n∈ N* = n +1 n +1 vn
Deci an =
n
u −u n+2 1 vn → ∞ şi n+1 n = (n + 1) ln = ln1 + vn+1 − vn n +1 n +1 1 nbn → 1. Deci an → . e
164
n +1
→ ln e = 1 . Aşadar
2.5.17. Observaţie D.M. Bătineţu-Giurgiu s-a ocupat în numeroase articole de şirul Ln = n+1 (n + 1)! − n n! (al lui Lalescu) şi de extinderi ale acestuia, reuşind să-l
transforme într-un şir care să rivalizeze prin frumuseţea sa cu şirul (en ) n≥1 care defineşte numărul e. Legătura dintre aceste două şiruri este dată de relaţia: n n +1
n +1
n , adică este de forma 0 a11 0 a 21 a 22 0 ... ... ... a n1 a n 2 a n 3 ... ... ...
... 0 ... 0 ... ... ... a nn ... ...
0 0 ... 0 ...
... ... ... . ... ...
Teorema 3.1.1. Fie (a nk )n ,k ≥1 o matrice triunghiulară infintă de numere reale şi
un şir ( x n )n≥1 de numere reale. Dacă (i)
lim a nk = 0 , ∀k ∈ N ∗ ;
(ii)
există M ∈ R+ astfel încât
(iii)
există lim x n şi lim x n = 0 ,
n →∞
∗
n →∞
n
∑a k =1
nk
≤ M , ∀n ∈ N ∗ ;
n→∞
n
atunci şirul (u n )n≥1 , definit prin u n = ∑ a nk x k , n ∈ N ∗ are limită şi k =1
lim u n = lim x n = 0 . n→∞
n →∞
Demonstraţie . Din lim x n = 0 rezultă că ∀ε > 0 , ∃nε ∈ N , ∀n ∈ N , n→∞
n ≥ nε ,avem că x n < un ≤
nε
∑ ank xk + k =1
ε 2M
n
. Pentru ∀n ∈ N , n ≥ nε avem
∑ ank xk ≤
k = nε +1
nε
∑ ank xk + k =1
168
n
∑a
k = nε +1
nk
⋅ xk ≤
≤
n ∑ a nk + a x ∑ nk k k = n +1 k =1 ε nε
(1) u n ≤
nε
∑a k =1
nk
xk +
ε 2
ε ⋅ 2 M , de unde , ţinând seama de (ii), obţinem , ∀n ∈ N , n ≥ nε .
nε
nε
k =1
k =1
(
)
Deoarece lim ∑ a nk x k = ∑ x k lim a nk = 0 , rezultă că ∃mε ∈ N , astfel încât n→∞
(2)
nε
∑a k =1
nk
xk
0 . Din lim x n = +∞ rezultă că există m = m(ε ) ∈ N (m depinde de ε ), astfel încât (3) x n > 3ε , ∀n ∈ N , n ≥ m .
n →∞
m
Deoarece lim(a n1 x1 + a n 2 x 2 + ... + a nm x m ) = ∑ x k (lim a nk ) = 0 , există m′ ∈ N , n→∞
k =1
n →∞
∀n ∈ N , n ≥ m′ avem că a n1 x1 + a n 2 x 2 + ... + a nm x m < ε , sau
(4)
− ε < a n1 x1 + a n 2 x 2 + ... + a nm x m < ε , ∀n ∈ N , n ≥ m′ . n
Deoarece lim ∑ a nk = 1 , ∀k ∈ N ∗ , rezultă că există m′′ ∈ N , astfel încât n→∞
k =1
2 , ∀n ∈ N , n ≥ m′′ . 3 Fie m0 = max(m, m′, m′′) . Atunci pentru ∀n ∈ N , n ≥ m0 , ţinând seama de (3)(5), avem că un = ( an1 x1 + an 2 x2 + ... + anm xm ) + (5)
a nm +1 + a nm + 2 + ... + a nn ≥
+ ( anm +1 x1 + anm + 2 x2 + ... + ann xn ) > −ε + 3ε ( anm +1 + anm + 2 + ... + ann ) ≥ 2 = ε , ceea ce înseamnă că lim u n = +∞ . Similar se demonstrează n →∞ 3 cazul când x = −∞ . O altă formulare a teoremei lui Toeplitz este dată de teorema 3.1.4. Teorema 3.1.4. Fie (a nk )n ,k ≥1 o matrice triunghiulară infinită de numere reale
≥ −ε + 3ε ⋅
pozitive şi un şir ( x n ) n≥1 de numere reale.Dacă (i)
lim a nk = 0 , ∀k ∈ N ∗ ; n →∞ n
(ii)
∑a k =1
(iii)
nk
= 1, ∀n ∈ N ∗ ;
există lim x n şi lim x n = x ∈ R , n →∞
n→∞
170
n
atunci şirul (u n )n≥1 , definit prin u n = ∑ a nk x k , n ∈ N ∗ are limită şi k =1
lim u n = lim x n = x . n→∞
n→∞
Demonstraţie. Demonstraţia este similară cu demonstraţiile din teoremele 3.1.1, 3.1.2 şi 3.1.3. Consecinţa 3.1.1. Fie un şir ( x n )n≥1 de numere reale care are limită. Atunci x + x 2 + ... + x n lim 1 = lim x n . n→∞ n →∞ n
Demonstraţie. În teorema 3.1.4 se consideră matricea 1 0 0 ... 0 0 ... 1 1 0 ... 0 0 ... 2 2 ... ... ... ... ... ... ... . 1 1 1 ... 1 0 ... n n n n ... ... ... ... ... ... ... Consecinţa 3.1.2. Fie un şir ( x n ) n≥1 de numere reale strict pozitive care are limită. Atunci n lim = lim x . n→∞ 1 1 1 n →∞ n + + ... + x1 x 2 xn
1 Demonstraţie. Se aplică consecinţa 3.1.1 şirului xn
. n≥1
Consecinţa 3.1.3. Fie un şir ( x n ) n≥1 de numere reale strict pozitive care are limită. Atunci lim n x1 ⋅ x 2 ⋅ ... ⋅ x n = lim x n . n→∞
n→∞
171
Demonstraţie. În inegalitatea mediilor x + x 2 + ... + x n n , n ∈ N ∗ , ţinând seama de ≤ n x1 ⋅ x 2 ⋅ ... ⋅ x n ≤ 1 1 1 1 n + + ... + x1 x 2 xn consecinţa 3.1.1 şi consecinţa 3.1.2 se trece la limită. Consecinţa 3.1.4. Fie un şir ( x n ) n≥1 de numere reale strict pozitive. Dacă şirul
x n +1 are limită, atunci şirul x n n≥1
(x) n
n n≥2
are limită şi lim n x n = lim n→∞
Demonstraţie. Fie şirul ( y n )n≥1 definit prin y1 = x1 , y n =
n →∞
x n +1 . xn
xn , ∀n ∈ N , n ≥ 2 . x n −1
Atunci x n = y1 ⋅ y 2 ⋅ ... ⋅ y n , ∀n ∈ N ∗ şi aplicând consecinţa 3.1.3 avem x lim n x n = lim n y1 ⋅ y 2 ⋅ ... ⋅ y n = lim y n = lim n +1 . n→∞ n →∞ n →∞ n →∞ x n Teorema 3.1.5. (Stolz-Cesaro) Fie (a n ) n≥1 şi (bn ) n≥1 două şiruri de numere reale cu proprietăţile (i) şirul (bn ) n≥1 este strict crescător, strict pozitiv şi nemărginit ; a − an a − an şi lim n +1 = l∈R. (ii) există lim n +1 n→∞ b n→∞ b n +1 − bn n +1 − bn a a Atunci există lim n şi lim n = l . n →∞ b n→∞ b n n
Demonstraţie. Fie şirurile (∆a n ) n≥1 , (∆bn ) n≥1 , definite prin a 0 = b0 = 0 ,
∆a n = a n − a n −1 , ∆bn = bn − bn −1 , ∀n ∈ N ∗ .Avem relaţia ∆b1 b1 ∆b1 b 2 ... ∆b1 bn ...
0 ∆b2 b2 ... ∆b2 bn ...
...
0
...
0
...
... ∆bn ... bn ... ...
∆a 0 ... 1 ∆b1 ∆a 0 ... 2 ⋅ ∆b2 ... ... ... ∆a 0 ... n ∆bn ... ... ...
172
a1 b1 a2 b = 2 ... an bn ...
∆bk ∆a k a 1 n deoarece ∑ ⋅ = ⋅ ∑ ∆a k = n , ∀n ∈ N ∗ . ∆bk bn k =1 bn k =1 bn Matricea infinită din membrul stâng satisface condiţiile din teorema 3.1.2 sau teorema 3.1.3. n
Bibliografie
[1] Achim, I., Transformări de şiruri, G.M. 7-8/1998, pag. 273-282. [2] Bătineţu, D.M., Probleme de matematică pentru treapta a II-a de liceu, Editura Albatros, Bucureşti, 1979 [3] Bătineţu, D.M. şi colectiv, Exerciţii şi probleme de analiză matematică pentru clasele a XI-a şi a XII-a, Editura Didactică şi Pedagogică, Bucureşti, 1981. [4] Miu, I.C., Câteva probleme de matematică, Craiova – S.C. Chimenerg S.A., pag. 33-45. [5] Sireţchi, Gh., Analiză matematică vol. III, Fasc.1 ed III, Centrul de multiplicare al Universităţii Bucureşti, 1984 [6] Sireţchi, Gh., Teorema lui Toeplitz şi câteva consecinţe ale sale, Gazeta Matematică nr.3/1985, pag. 65-70.
173
Probleme rezolvate R3.2.1. Fie şirul ( x n )n≥1 cu lim x n = x , x ∈ R . Să se arate că n→∞
x x x lim n1−1 + n2− 2 + ... + n = 2 x . n→∞ 2 1 2 Soluţie. Se consideră a nk =
1 2
n +1− k
, n, k ∈ N ∗ , k ≤ n . Deoarece lim a nk = 0 , n →∞
1 1 < 1 , ∀n ∈ N ∗ , lim ∑ ank = lim1 − n = 1 , n n→∞ n→∞ 2 2 k =1 k =1 sunt îndeplinite condiţiile din n n 1 1 teorema 3.1.2, deci lim ∑ n +1− k x k = x , de unde lim ∑ n − k x k = 2 x . n→∞ n →∞ k =1 2 k =1 2
k ∈ N∗,
n
∑a
nk
n
= 1−
R3.2.2. Dacă lim x n = x , x ∈ R , atunci n→∞
lim n→∞
nx1 + (n − 1) x 2 + ... + 2 ⋅ x n −1 + 1 ⋅ x n x = . 2 n2
2(n − k + 1) , n, k ∈ N ∗ , k ≤ n . Deoarece 2 n n n2 + n n(n + 1) 2 n − = ≤ 2 , ∀n ∈ N ∗ , lim a nk = 0 , k ∈ N ∗ , ∑ a nk = 2 k 2 2 ∑ 2 n →∞ n n n k =1 k =1 2 n n +n lim ∑ a nk = lim = 1 , sunt îndeplinite condiţiile din teorema 3.1.2, deci n→∞ n →∞ n2 k =1 n 2(n − k + 1) lim ∑ ⋅ x k = x , de unde rezultă concluzia. n→∞ n2 k =1
Soluţie. Se consideră a nk =
R3.2.3. Fie un şir (x n )n≥0 de numere reale care are limită. Atunci 1 n→∞ 2 n
lim
n
∑x C k =0
k
k n
Soluţie. Se consideră matricea
174
= lim x n . n →∞
1 1 0 C1 2 1 C0 22 2 ... 1 0 n Cn 2 ... deci a nk =
0 1 1 C1 2 1 1 C2 22 ... 1 1 Cn 2n ...
0
...
0
0
...
0
...
0
1 2 C2 22 ... 1 2 Cn 2n ...
...
... 1 n Cn ... 2n ... ...
0 ... 0 ... 0 ... , ... ... 0 ... ... ...
1 k C n , k ∈ {0,1,..., n} . Se aplică teorema 3.1.2 sau teorema 3.1.3. 2n
175
4. Şiruri recurente Una dintre temele abordate in manualul de clasa a X-a o constituie “Şirurile recurente” mai precis determinarea formei generale a şirurilor definite prin recurenţe liniare de ordinul întâi şi recurenţe liniare şi omogene de ordinul doi. În cele ce urmează vom reaminti aceste rezultate ca punct de pornire în studiul convergenţei şirurilor recurente. 4.1. Recurenţe liniare de ordinul I 4.1.1. Definiţie. O relaţie de recurenţă de forma xn+1 = an xn + bn , ∀ n ∈ N ,
(4.1.1)
unde (a n ) n≥0 şi (bn ) n≥0 sunt şiruri de numere reale se numeşte relaţie de recurenţă liniară de ordinul 1 cu coeficienţi variabili. 4.1.2. Observaţii. i)Considerând cazuri particulare pentru şirurile (a n ) n≥0 şi (bn ) n≥0 se regăsesc progresiile aritmetică, respectiv geometrică. ii) Dacă an = a şi bn = f (n) , unde f : N → R obţinem xn+1 = axn + f (n) , adică o relaţie de recurenţă liniară, neomogenă de ordinul 1.
În cazul unei recurenţe liniare de ordinul 1 se poate determina forma generală a şirului. 4.1.3. Teoremă. Forma generală a şirului ( xn ) n≥0 dat prin relaţia de recurenţă (4.1.1) este: n −1 xn+1 = a0 a1 ...an x0 + ∑ bk ak +1ak + 2 ...an + bn (4.1.2) k =0 4.1.4. Corolar. Forma generală a şirului ( xn ) n≥0 dat prin relaţia de recurenţă xn+1 = axn + f (n), ∀ n ≥ 0 (4.1.3) unde a ∈ R, f : N → R este n −1
xn = a n x0 + ∑ f (k )a n− k −1 .
(4.1.4)
k =0
4.1.5. Corolar. Forma generală a şirului ( xn ) n≥0 dat prin relaţia de recurenţă xn+1 = axn + b, ∀ n ∈ N (4.1.5) este: 176
xn = a n x0 + b(a n−1 + a n−2 + ... + 1)
(4.1.6)
4.1.6 Observaţii. Ne propunem să discutăm convergenţa şirului ( xn ) n≥0 dat prin relaţia de recurenţă (4.1.5). Pentru a putea vizualiza comportarea şirului ( xn ) vom reprezenta întrun sistem de coordonate graficul funcţiei f ( x) = ax + b şi prima bisectoare y = x (în general pentru o relaţie de recurenţă de ordinul 1, xn+1 = f ( xn ) se reprezintă graficul funcţiei f şi prima bisectoare). Pentru început se reprezintă punctul x0 pe axa Ox. Paralela dusă prin punctul de coordonate ( x0 , f ( x0 ) = x1 ) la axa Ox intersectează prima bisectoare în punctul de abscisă x1. Continuând procedeul obţinem pe axa Ox termenii şirului ( xn ) . b>0 ∞, - pentru a = 1 , avem xn = x0 + (n − 1)b şi lim xn = x0 , b = 0 (fig. 4.1) n →∞ − ∞ , b < 0
a=1
şi b>0
x0 y=ax+b
x1
x2
x3
...
∞
y=x
Fig. 4.1 În acest caz cele două drepte (d1 ) : y = x + b şi (d 2 ) : y = x sunt paralele. Dacă b > 0 , dreapta d1 este situată deasupra dreptei d 2 , dacă b = 0 cele două drepte coincid, iar dacă b < 0 dreapta d1 este situată sub dreapta d 2 . b b - pentru a ≠ 1 avem xn = a n x0 + − a −1 a −1 b (fig. 4.2), adică tocmai soluţia - dacă a ∈ (−1,1) avem lim xn = n →∞ 1− a ecuaţiei f ( x) = x . 177
y=x
a∈(-1,1)
y=ax+b, |a|1 şi x0>
b 1− a b x0 < 1− a
a > 1 si
x0 >
a > 1 si a < −1 x0 =
(fig. 4.3)
b 1− a
b 1− a
y=ax+b
y=x
b 1− a
x0 x1
Fig. 4.3a
178
x2...xn → ∞
y=ax+b
y=x
a x0 , deci conform Teoremei 4.5.5 şirul ( xn ) este strict crescător şi mărginit deci convergent către soluţia ecuaţiei f ( x) = x , adică lim xn = 2 . n →∞
b) Fie f : [0,1] → [0,1] , f ( x) = 1 − x 2 , avem f continuă, strict descrescătoare deci şirurile ( x2 n ) n∈N şi ( x2 n+1 ) n∈N sunt monotone de monotonii diferite. Fie g ( x) = ( f o f )( x) = x , deci subşirurile ( x2 n ) şi ( x2 n +1 ) sunt constante. În concluzie şirul ( xn ) este convergent dacă şi numai dacă x0 = x1 , adică pentru x0 =
2 . 2
1 a ( p − 1) xn + p −1 , n ≥ 0 , x0 > 0 , a ≥ 0 , p xn p p ∈ N , p ≥ 2 este convergent şi lim xn = a .
2) Să se arate că şirul xn+1 =
n →∞
(D. M. Bătineţu, I. M. Stancu-Minasian, GMA 12/1973) Soluţie. Metoda I. Considerăm f : (0, ∞) → R , a 1 f ( x) = ( p − 1) x + p −1 . p x f continuă şi derivabilă pe (0, ∞) şi p −1 a f ' ( x) = 1 − p . p x Tabelul de variaţiei al funcţiei f este: p x 0 a ∞ f ' ( x) - - - - - - - - - - 0 + + + + + + + + f (x) ∞
p
∞
a
194
p
p
Deci f ( x) ≥ a , ∀ x ∈ (0, ∞) . Întrucât xn+1 = f ( xn ) ≥ a , ∀ n ≥ 0 , p
rezultă că xn ≥ a , ∀ n ≥ 1 . p
Considerând g = f /[ a ,+∞) , avem xn+1 = g ( xn ), ∀ n ≥ 1 , g derivabilă şi | g ' ( x) |< 1 , deci aplicând teorema 4.5.15 rezultă că şirul ( xn ) n≥0 este convergent către unica soluţie a ecuaţiei g ( x) = x , anume
p
p
a . Deci lim xn = a . n →∞
Metoda II. Din modul cum a fost definit şirul, rezultă că xn > 0 , ∀ n ∈ N . Observăm că: p −1) ori 64de4( 7 448 a xn + xn + ... + xn + p −1 xn p xn+1 = ≥ a p conform inegalităţii mediilor. p Deci xn ≥ a , ∀ n ≥ 1 .
xn+1 1 a = p − 1 + p ≤ 1 , deci şirul este descrescător. xn p xn Fiind monoton şi mărginit rezultă că este convergent. Trecând la limită p în relaţia de recurenţă obţinem lim xn = a .
Avem
n →∞
3) Se consideră un şir (u n ) definit prin relaţia de recurenţă 1 u n+1 = (64u n + 15)1 / 3 . 4 Să se stabilească modul de comportare al acestui şir pentru n → ∞ . (Problemă analizată de juriu a 22-a OIM SUA, 1981) 1 Soluţie. Funcţia f : R → R , f ( x) = 3 64 x + 15 este strict crescătoare 4 şi u n+1 = f (u n ) . Conform teoremei 4.5.5 există trei proprietăţi: i) dacă u 0 = u1 atunci şirul este constant şi lim u n = u0 n →∞
1 1 ± 61 u 0 = u1 ⇔ 64u 03 − 6u 0 − 15 = 0 ⇔ u0 ∈ − , . 8 4 ii) dacă u 0 < u1 atunci şirul (u n ) n≥0 este strict crescător. 1 − 61 1 1 + 61 ,− ∪ ,+∞ . Aceasta are loc pentru u 0 ∈ 4 8 8 iii) dacă u 0 > u1 atunci şirul (u n ) n≥0 este strict descrescător.
195
1 − 61 1 1 + 61 ∪− , . Aceasta are loc pentru u 0 ∈ − ∞, 4 8 8 Fiind monoton, şirul (u n ) n≥0 are întotdeauna limită finită sau infinită. Dacă şirul (u n ) n≥0 este convergent atunci conform teoremei 4.5.6: lim u n = u şi n →∞
1 − 61 1 1 + 61 u∈ ,− , . Analizând combinaţiile obţinute anterior 8 4 8 concluzionăm: 1 − 61 atunci u n → −∞ dacă u 0 < 8 1 − 61 1 1 ,− atunci u n ↑ − dacă u 0 ∈ 4 4 8 1 1 + 61 1 atunci u n ↓ − dacă u 0 ∈ − , 8 4 4 1 + 61 ,+∞ atunci u n → +∞ . dacă u 0 ∈ 8
Alte recurenţe. Probleme rezolvate În acest paragraf vom aborda câteva recurenţe neliniare. Unele dintre ele se reduc (prin logaritmare sau substituţii convenabile) la recurenţe mai simple sau chiar liniare, iar altele se vor rezolva utilizând teorema lui Weierstrass de convergenţă a unui şir. R4.5.18. Se consideră şirul (an ) n≥0 cu a n+1 = n n + a nn−1 , ∀ n ∈ N * , n ≥ 2 şi a 2 > 0 . Determinaţi an şi limita sa. (V. Băndilă, Ol. locală Bucureşti) Soluţie. Evident avem an > 0, ∀ n ≥ 2 , relaţie demonstrabilă prin inducţie. Relaţia devine: ann+1 = n + ann−1 şi vom folosi substituţia bn = ann −1 , ∀ n ≥ 2 .
196
Avem bn+1 = bn + n, ∀ n ≥ 2 . Dând valori lui n şi însumând obţinem: (n − 1)n (n − 1)n − 1 , de unde a n = n−1 a 2 − 1 + , ∀ n ≥ 2 . Trecând la 2 2 limită obţinem lim an = 1 . bn = b2 +
n →∞
R4.5.19. Se dă şirul ( xn ) n≥0 cu xn > 0, ∀ n ≥ 0 care satisface relaţia: xn+1 = 3 xn + 6 xn−1 , ∀ n ∈ N * şi x0 = x1 = 1 . Arătaţi că şirul este convergent şi calculaţi-i limita. Soluţie. Notăm y n = 6 xn , y0 = y1 = 1 . Relaţia de recurenţă devine: y n3+1 = y n3 + y n−1 , ∀ n ≥ 1 . Se arată prin inducţie că şirul ( y n ) este crescător şi mărginit superior de 2. Deci ( y n ) n≥0 este convergent, fie l = lim y n . Obţinem n →∞
3
5 +1 5 +1 . şi lim xn = n →∞ 2 2 R4.5.20. Studiaţi convergenţa şirului ( xn ) n≥0 dat de:
l(l 2 − l − 1) = 0 , de unde l =
xn+1 xn−1 = xn 2 , ∀ n ≥ 1 cu xn ≥ 0, ∀ n ≥ 0 . Soluţie. Dacă x0 = 0 atunci xn = 0, ∀ n ∈ N şi şirul fiind constant este convergent spre 0. Dacă x0 > 0 şi x1 = 0 atunci x2 = 0 şi prin inducţie obţinem xn = 0, ∀ n ∈ N , n ≥ 2 , deci şirul este convergent spre 0. Dacă x0 > 0 şi x1 > 0 , atunci se demonstrează prin inducţie că xn > 0, ∀ n ∈ N . Logaritmând relaţia de recurenţă şi notând y n = ln xn , n ∈ N obţinem: y n+1 + y n−1 = 2 y n , deci o relaţie de recurenţă liniară şi omogenă de ordinul 2. Ecuaţia caracteristică este: π π r 2 − 2r + 1 = 0, r1, 2 = cos ± i sin . 4 4 nπ nπ Deci y n = c1 cos + c2 sin , ∀ n ∈ N . Şirul este aşadar periodic de 4 4 perioadă 8 (adică y n+8 = y n , ∀ n ∈ N ) şi el este convergent dacă şi numai dacă c1 = c2 = 0 , adică y0 = y1 = 0 deci x0 = x1 = 1 , în acest caz limita şirului fiind 1.
197
R4.5.21. Se dă ( xn ) n≥1 , x1 > 0 şi x12 + x1 < 1 cu xn+1 = xn + că şirurile ( y n ) n≥2 , cu y n =
xn2 . Arătaţi n2
1 1 şi ( xn ) n≥1 sunt convergente. − xn n − 1
xn2 Soluţie. Avem xn+1 − xn = 2 ≥ 0 , deci şirul ( xn ) n≥0 este crescător. Se n arată prin inducţie că xn < n − 1, ∀ n ≥ 2 . Avem că xn 1 xn 1 n > 0, − > − 1 n 2 n − 1 xn+1 n xn +1 este de asemenea crescător. y n+1 − y n =
de unde ( y n ) n≥2
Presupunem că există n0 ∈ N * astfel încât xn0 > 1 ⇒ xn > 1, ∀ n ≥ n0 ⇒ 1 1 1 n−2 − < 1− = < 1, ∀ n ≥ n0 , deci şirul ( y n ) n≥2 este xn n − 1 n −1 n −1 convergent cu limita y şi 0 < y 2 ≤ y ≤ 1 . 1 Întrucât xn = şi ( y n ) este convergent, urmează că ( xn ) n∈N* 1 yn + n −1 1 este convergent cu limita x = . y * Dacă nu există n0 ∈ N astfel încât xn0 > 1 ⇒ xn ≤ 1, ∀ n ∈ N ⇒ ( xn ) este ⇒ yn =
1 1 convergent la x şi 0 < x1 ≤ x ≤ 1 ⇒ este convergent la , deci ( y n ) n≥2 x xn n≥ 2 1 este convergent la y = . x
198
5. Câteva clase de şiruri 5. 1. Şiruri definite implicit Se consideră un şir de funcţii reale ( f n ) n≥1 cu proprietatea că fiecare dintre ecuaţiile f n ( x) = 0 admite câte o singură soluţie situată într-o mulţime M fixată, soluţie pe care o notăm xn. Spunem că şirul ( xn ) n ≥1 este definit implicit. În cazuri concrete se pune problema demonstrării existenţei şi unicităţii soluţiei xn (mai rar a calculului ei) şi apoi a stabilirii unor proprietăţi ale şirului ( xn ) n ≥1 . Există posibilitatea şi ca funcţiile fn să nu fie definite pe mulţimi de numere reale (spre exemplu să fie definită pe submulţimi din 2 ), în general neexistând metode care să conducă la o abordare unitară a acestor probleme. Exemple: 1) Demonstraţi că pentru fiecare număr natural n, ecuaţia sin x = x + n admite soluţie unică (pe care o notăm xn). Stabiliţi natura şirurilor ( xn ) n≥0 şi xn . n n≥1 Soluţie: Funcţia f n :
→ , f n ( x) = sin x − x − n , este injectivă fiind strict descrescătoare şi este continuă. În plus lim f n ( x) = +∞ şi x →−∞
lim f n ( x) = −∞ . x →∞
Deducem că ecuaţia f n ( x) = 0 admite o unică soluţie reală, pe care o notăm xn. x sin xn Deoarece sin xn = xn + n , obţinem xn = sin xn − n şi n = −1 . n n x Şirul ( xn ) n ≥1 este divergent şi are limita −∞ , iar şirul n este n n≥1 convergent la −1. 2) Considerăm şirurile ( xn ) n ≥1 şi ( yn ) n≥1 cu termenii numere raţionale astfel încât xn + yn 2 = (1 + 2 ) n , (∀) n ∈ x lim n . n →∞ y n
199
*
. Calculaţi
lim xn , lim yn şi n →∞
n →∞
Soluţie: Ştim că pentru fiecare n ∈ * , există şi sunt unice numerele raţionale xn şi yn astfel ca xn + yn 2 = (1 + 2 ) n , ceea ce înseamnă că şirurile
sunt
bine
definite
(
f n ( x, y ) = x + y 2 − 1 − 2
(altfel
)
n
spus
fn :
funcţiile
2
→
,
sunt injective şi admit rădăcină).
(
Ştim de asemenea că x n − y n 2 = 1 − 2
)
n
. Rezultă imediat
(1 + 2 ) n + (1 − 2 ) n (1 + 2 ) n − (1 − 2 ) n , yn = . 2 2 2 Observăm că în acest caz am reuşit să stabilim rădăcina funcţiei fn. xn =
n
1− 2 1+ 1+ 2 n = +∞ . lim xn = lim (1 + 2 ) ⋅ n →∞ n →∞ 2 x Analog lim yn = +∞ şi apoi lim n = 2 . n →∞ n →∞ y n
3) Să se arate că ecuaţia x n − x n −1 − K − x − 1 = 0 are o singură rădăcină reală pozitivă xn pentru orice n ∈ * şi să se determine lim xn . n →∞
Soluţie. Pentru n = 1 , x1 = 1 , iar pentru n ≥ 2 ecuaţia are rădăcină pe 1
x n − 1 x n +1 − 2 x n + 1 = . şi atunci x − x − K − x − 1 = x − x −1 x −1 Considerăm funcţia f n ( x) = x n +1 − 2 x n + 1 şi avem : n
n −1
n
f n′( x) = (n + 1) x n − 2n ⋅ x n −1 = x n −1 ((n + 1) x − 2n) . Tabelul de variaţie al funcţiei f n pe intervalul [0, ∞) este: x f n′ fn
0 0 − − 1
1 −
− 0
−
f n′( x) = 0 pentru x = yn =
−
2n . n +1
200
2n n +1 0 + +
+
zn
1
∞
2 +
+
+ + +
2n Avem: f = zn < 0 şi f (2) = 1 > 0 deci unica rădăcină a ecuaţiei n +1 2n f n ( x) = 0 , diferită de 1, pozitivă este xn ∈ ,2 şi atunci lim xn = 2 . x →∞ n +1 3 2 4. Să se arate că ecuaţia x − x − x − 1 = 0 are o singură rădăcină reală notată cu x1 şi să se determine lim( x2n + x3n ) unde x2 , x3 sunt celelalte două n →∞
rădăcini ale ecuaţiei. Soluţie. Considerăm
funcţia f: → , f ( x) = x3 − x 2 − x − 1 , 1 f ′( x) = 3x 2 − 2 x − 1 = 3( x − 1) x + . Tabelul de variaţie 3 x f′
+
f
−∞
1 3 0− − 1 f − 3
−
−∞
+
+
0 −
+∞
1 −
0
+
+
+
+
f (1)
1 Avem: f − < 0 , f (1) < 0 şi f (∞) > 0 deci există o unică rădăcină reală 3 x1 ∈ (1, ∞) . Celelalte două rădăcini x2 , x3 sunt complex-conjugate x2,3 = a ± ib = ρ (cos t ± i sin t ) .
Din relaţiile lui Viette, x1 ⋅ x2 ⋅ x3 = 1 şi din x1 > 1 rezultă x2 ⋅ x3 < 1 sau
ρ 2 < 1 , deci ρ < 1 . Avem:
x2n + x3n = 2cos nt ⋅ ρ n ,0 ≤ x2n + x3n < 2 ρ n → 0 ,
deci
lim( x2n + x3n ) = 0 . n →∞
5. Să se arate că pentru n ∈ notată xn şi să se determine
*
ecuaţia 2 x + x = n are o unică soluţie
x lim n ⋅ n − 1 . n →∞ log 2 n Soluţie. Funcţia f : → , f ( x) = 2 x + x este strict crescătoare, bijectivă cu inversa crescătoare şi atunci xn = f −1 (n) , lim xn = ∞ . n →∞
201
Avem: x x − log 2 (2 xn + xn ) = lim n n − 1 = lim(2 xn + xn ) n xn n →∞ n →∞ + log n log (2 x ) 2 2 n x x x − log 2 (2 + x) 2 + x 2 x ( x − log 2 (2 x + x)) x = lim(2 + x) = lim x ⋅ = x →∞ x →∞ log 2 (2 x + x) log 2 (2 x + x) 2 x⋅ x x x x x x 2 ( x − log 2 (2 + x)) 2 (log 2 2 − log 2 (2 + x)) = lim = lim = x →∞ x →∞ x x x 2x + x x log 2 1 + x −2 log 2 x 2 = 2 = lim = lim − x →∞ x →∞ x x 2x log 2 (1 + t ) 1 1 = lim − =− = log 2 . t →∞ t ln 2 e * 6. a) Să se arate că pentru orice n ∈ ecuaţia x x n + (n + 1) = (n + 2) x are o singură soluţie xn . x b) Să se arate că şirul ( yn ) n , yn = n este convergent şi să se determine n limita sa. x
x
n n +1 Soluţie. a) Considerăm funcţia f n : → , f n ( x) = + n+2 n+2 care este descrescătoare, f n (−∞) = ∞ , f n (0) = 2 > 1 , f n (∞) = 0 < 1 deci există un singur xn ∈ (0, ∞) cu f n ( xn ) = 1 sau n xn + (n + 1) xn = (n + 2) xn . yn
b)
Avem:
xn = n ⋅ yn
şi
relaţia
x
yn
n n n + 1 n + = 1 . n + 2 n + 2
x
n
x x +1 n Considerând funcţiile şi se arată că şirurile an = şi x+2 x+2 n+2 n
n +1 bn = sunt n+2 anyn < any+n 1 , bnyn < bny+n1
descrescătoare. deci
Avem:
an < an +1 , bn < bn +1 ,
1 = anyn + bnyn < any+n 1 + bny+n1 ,
202
atunci
1 = anyn+1 + bny+n1+1 < any+n 1 + bny+n1 . Deoarece an +1 < 1 şi bn +1 < 1 rezultă yn +1 > yn , deci şirul ( yn ) n este crescător. Arătăm că şirul ( yn ) n este mărginit: dacă prin absurd ar exista un subşir ( ynk ) k cu lim ynk = +∞ am avea k →∞
n nk lim k k →∞ n + 2 k
ynk
=e
în contradicţie cu lim(ank ) k →∞
ynk
−2 lim ynk k →∞
+ (bnk )
n + 1 nk = 0 , lim k k →∞ n + 2 k ynk
ynk
=e
− lim ynk k →∞
=0,
= lim1 = 1 . k →∞
Deci şirul ( yn ) n este convergent şi trecând la limită în relaţia anyn + bnyn = 1 rezultă e −2l + e − l = 1 , din care rezultă el =
1+ 5 1+ 5 , deci lim yn = ln . n →∞ 2 2
5. 2. Şiruri cu mulţimea termenilor finită
Fie M o mulţime finită. Considerăm cunoscute următoarele rezultate elementare: 5. 2. 1. Propoziţie. Dacă ( xn ) n ≥1 este un şir de elemente din M, atunci ( xn ) n ≥1 admite cel puţin un subşir constant. 5. 2. 2. Propoziţie. Dacă ( xn ) n ≥1 este un şir convergent de elemente din M, atunci ( xn ) n ≥1 este constant începând cu un anumit rang. 5. 2. 3. Definiţie. Un şir ( xn ) n ≥1 se numeşte periodic dacă există p∈
*
astfel încât xn + p = xn , (∀) n ∈
*
. Numărul p se numeşte perioadă a
şirului. 5. 2. 4. Propoziţie. Un şir periodic este convergent dacă şi numai dacă este constant. Ne propunem să analizăm două dintre cele mai dificile probleme date în ultimii ani la Olimpiada Naţională şi să sugerăm o metodă de rezolvare ale unor probleme asemănătoare. La primul baraj de selecţie a lotului olimpic din 1996 s-a dat următoarea problemă: P.5.2.5. Fie x, y numere reale. Să se arate că dacă mulţimea Ax , y = {cos nπ x + cos nπ y n ∈ } este finită, atunci x ∈ şi y ∈ . Soluţie. Fie xn = cos nπ x şi yn = cos nπ y , an = xn + yn . Avem:
( xn + yn ) 2 + ( xn − yn ) 2 = 2( xn2 + yn2 ) = 2 + ( x2 n + y2 n ) ⇔ ( xn − yn ) 2 = 2 + a2 n − an2 . 203
{a
Deoarece mulţimea
n
n∈
}
este finită, rezultă că mulţimea
} este finită. Avem: x = 12 (a mulţimile { x n ∈ } şi { y n ∈ } sunt finite. {b
n
= xn − yn n ∈ n
Există
p≠q
n
n
1 + bn ) , yn = (an − bn ) deci 2
n
astfel ca
x p = xq
şi există r ≠ s
yr = y s ⇔
astfel ca
⇔ cos pπ x = cos qπ x şi cos rπ y = cos sπ y ⇒ pπ x ± qπ x ∈ 2π ⋅ şi rπ y ± sπ y ∈ 2π ⋅ ⇒ x ∈ şi y ∈ . Observaţie. Reciproca afirmaţiei din problemă este evident adevărată. O formulare care generalizează Problema 5.2.5. este imediată: P.5.2.6. Fie k ∈ * un număr natural şi x1 , x2 ,K , xk numere reale. Să se
arate că mulţimea Ax , y = {cos nπ x1 + cos nπ x2 + K + cos nπ xk n ∈
}
este finită
dacă şi numai dacă numerele x1 , x2 ,K , xk sunt raţionale. Soluţie. Se observă că soluţia Problemei 5.2.5., deşi foarte elegantă, nu oferă idei pentru rezolvarea problemei 5.2.6. Fie an = cos nπ x1 + cos nπ x2 + K + cos nπ xk . Dacă mulţimea
A = {an n ∈
B = {(an , a2 n , a3n ,K , akn ) n ∈
}
este finită, atunci şi mulţimea
} este finită, deci există m ≠ n astfel ca
(an , a2 n , a3n ,K , akn ) = (am , a2 m , a3m ,K , akm ) . Dacă notăm y1 = nx1π ,K , yk = nxkπ ; z1 = mx1π ,K , zk = mxkπ obţinem relaţiile cos y1 + K + cos yk = cos z1 + K + cos zk cos 2 y + K + cos 2 y = cos 2 z + K + cos 2 z 1 k 1 k S: KKKKKKKKKKKKKKKKKK cos ky1 + K + cos kyk = cos kz1 + K + cos kzk Se ştie că funcţia cos px se exprimă ca un polinom de grad p în raport cu cos x (Se obţine din relaţia (cos x + i sin x) p = cos px + i sin px ). Sistemul S este echivalent cu sistemul S’ b1 + K + bk = c1 + K ck 2 2 2 2 b1 + K + bk = c1 + K + ck S′ : KKKKKKKKKK b k + K + b k = c k + K + c k k 1 k 1 204
unde bi = cos yi , ci = cos zi , i = 1, k . Relaţiile sistemului S’ spun că polinomul (unitar) cu rădăcinile b1 ,K , bk coincide cu polinomul (unitar) cu rădăcinile c1 ,K , ck , deci (c1 ,K , ck ) este o permutare a lui ( b1 ,K , bk ). Există o permutare σ ∈ Sk astfel ca: c1 = bσ (1) ,K , ck = bσ ( k ) ⇔ cos mπ x1 = cos nπ xσ (1) ,K , cos mπ xk = cos nπ xσ ( k ) ⇔ ⇔ mπ x1 ± nπ xσ (1) ∈ 2π ⋅ ,K , mπ xk ± nπ xσ ( k ) ∈ 2π ⋅ . S-a obţinut un sistem de ecuaţii liniare cu necunoscutele x1 , x2 ,K , xk şi cu coeficienţi raţionali (întregi), care are soluţie unică (deoarece m ≠ n ) formată din numere raţionale. P.5.2.7. Fie k ∈ * , z1 , z2 ,K , zk ∈ * distincte şi u1 , u2 ,K , uk ∈ * , astfel ca mulţimea {an = u1 ⋅ z1n + u2 ⋅ z2n + K + uk ⋅ zkn n ∈ arate că există p ∈
*
}
astfel ca an = an + p , oricare ar fi n ∈
Soluţii. Soluţia 1. Dacă mulţimea
mulţimea {(an , an +1 ,K , an + k ) n ∈
{a
n
n∈
}
să fie finită. Să se .
este finită, atunci şi
} este finită, deci există m ≠ n astfel ca:
(an , an +1 ,K , an + k −1 ) = (am , am +1 ,K , am + k −1 ) . Notând m − n = p obţinem relaţiile
u1 ⋅ z1n ( z1p − 1) + u2 ⋅ z2n ( z2p − 1) + K + uk ⋅ zkn ( zkp − 1) = 0 n +1 p n +1 p n +1 p u1 ⋅ z1 ( z1 − 1) + u2 ⋅ z2 ( z2 − 1) + K + uk ⋅ zk ( zk − 1) = 0 KKKKKKKKKKKKKKKKKKKKKK u ⋅ z n + k −1 ( z p − 1) + u ⋅ z n + k −1 ( z p − 1) + K + u ⋅ z n + k −1 ( z p − 1) = 0 k k k 1 2 2 2 1 1 Privind relaţiile ca sistem de ecuaţii liniare cu necunoscutele p x1 = z1 − 1, x2 = z2p − 1,K , xk = zkp − 1 , determinantul sistemului este: u1 ⋅ z1n
u2 ⋅ z2n
u1 ⋅ z1n +1 K
u2 ⋅ z2n +1 K
K K K
uk ⋅ zkn k uk ⋅ zkn +1 = ∏(ui ⋅ zin ) ⋅ ∏ ( zi − z j ) ≠ 0 , i =1 1≤ j < i ≤ k K
u1 ⋅ z1n + k −1 u2 ⋅ z2n + k −1 K uk ⋅ zkn + k −1
deci sistemul admite doar soluţia banală şi atunci z1p = z2p = K = zkp = 1 , deci zin = zin + p , n ∈
şi an = an + p , n ∈
.
Problema are o soluţie mai elegantă, care foloseşte doar cunoştinţe de clasa a X-a. 205
Soluţia a doua. Se bazează pe următoarea observaţie: Dacă mulţimea A = {an n ∈ } este finită, atunci pentru orice număr b∈
, mulţimea B = {an +1 − b ⋅ an n ∈
} este finită.
Luând b = zk avem: an +1 − zk an = u1 z1n +1 + K + uk −1 zkn−+11 + uk zkn +1 − u1 ⋅ zk z1n − K − uk −1 ⋅ zk zkn−1 − uk ⋅ zkn +1 =
= u1 ( z1 − zk ) ⋅ z1n + K + uk −1 ( zk −1 − zk ) ⋅ zkn−1 = v1 ⋅ z1n + K + vk −1 ⋅ zkn−1 . Ne-am redus de la o mulţime Ak la o mulţime Bk +1 , verificând aceleaşi ipoteze, deci prin inducţie după k, demonstraţia este imediată. O generalizare a acestei probleme, pentru ideea din prima soluţie nu conduce la rezolvare, este P.5.2.8. Fie P, Q, R ∈ [ X ] polinoame nenule şi a, b, c ∈ * numere complexe, nenule şi distincte. Să se arate că dacă mulţimea: Z = { z n = P ( n) ⋅ a n + Q ( n) ⋅ b n + R ( n) ⋅ c n n ∈ } este finită, atunci există p ∈
*
astfel ca zn + p = zn , n ∈
Soluţie. Z finită ⇒ Z1 = { zn +1 − a ⋅ zn n ∈
.
} finită.
zn +1 − a ⋅ zn = [a ( P(n + 1) − P(n))] ⋅ a n + [b ⋅ Q(n + 1) − a ⋅ Q(n)] ⋅ b n +
+[c ⋅ R(n + 1) − a ⋅ R(n)] ⋅ c n = P1 (n) ⋅ a n + Q1 (n) ⋅ b n + R1 (n) ⋅ c n , unde P, Q, R ∈ [ X ] şi grad P1 < grad P , grad Q1 = grad Q , grad R1 = grad R (avem aceeaşi ipoteză dar gradul lui P a scăzut). Dacă P1 ≠ 0 , considerăm mulţimea Z 2 = {un +1 − aun n ∈ } , unde un = P1 (n) ⋅ a n + Q1 (n) ⋅ b n + R1 (n) ⋅ c n , care este finită, şi rezultă Z 2 = {vn = P2 (n) ⋅ a n + Q2 (n) ⋅ b n + R2 (n) ⋅ c n n ∈
}
şi grad P2 < grad P1 , grad Q2 = grad Q = gradQ1 , grad R2 = grad R1 = grad R . După cel mult k paşi de acest fel (k = grad P + 1) obţinem Pk = 0 şi
mulţimea Z ′ = { zn′ = Q′(n) ⋅ b n + R′(n) ⋅ c n n ∈ Considerăm mulţimea Z1′ = { zn′ +1 − b ⋅ zn′ n ∈
} finită.
} = {Q′(n) ⋅ b
n
+ R′(n) ⋅ c n n ∈
finită cu grad Q1′ = grad Qn′ şi grad R1′ = grad R′ . La fel ca mai sus, scăpăm de b şi obţinem mulţimea finită Z ′′ = { zn′′ = R′′(n) ⋅ c n n ∈ } , 206
},
unde grad R′′ = grad R . În mod analog, scădem gradul lui R′′ până la un polinom constant, deci ajungem la mulţimea finită {α ⋅ c n n ∈ } . Există p1 ∈ * astfel ca c p1 = 1 . Analog obţinem b p2 = 1, c p3 = 1 , deci a p = b p = c p = 1 , unde p = p1 ⋅ p2 ⋅ p3 .
Mulţimea U = { zk + p k ∈
}
este finită ⇔ { P(k ⋅ p ) + Q(k ⋅ p ) + R (k ⋅ p ) k ∈
}
este finită. Rezultă că polinomul f ( x) = P( x) + Q( x) + R( x) = a0 este constant. Mulţimea
V = { zk ⋅ p +1 k ∈
}
este
finită,
deci
g ( x) = a ⋅ P ( x) +
polinomul
+b ⋅ Q( x) + c ⋅ R( x) = a1 este constant şi din mulţimea finită W = { zk ⋅ p + 2 k ∈
}
obţinem polinomul constant h( x) = a ⋅ P ( x) + b ⋅ Q( x) + c ⋅ R( x) = a2 . Din relaţiile f = a0 , g = a1 , h = a2 rezultă că polinoamele P, Q, R sunt constante. Se obţine an + p = an , n ∈ . 2
2
2
O generalizare a problemei P.5.2.8, a cărei soluţie este asemănătoare este: P.5.2.9. Fie k ∈ * , z1 , z2 ,K , zk ∈ * distincte şi f1 , f 2 ,K , f k ∈ [ X ] polinoame nenule. Să se arate că dacă mulţimea { f1 (n) ⋅ z1n + f2 (n) ⋅ z2n + K + f k (n) ⋅ zkn n ∈ }
este finită, atunci polinoamele sunt constante şi există p ∈ * astfel ca z1p = z2p = K = zkp = 1 . Soluţie. Se face inducţie după k, urmărind soluţia problemei P.5.2.8. 5.3. Evaluarea unor serii prin şiruri
Unele probleme cu caracter teoretic conţin idei ce permit deducerea multor tipuri de probleme: În general, o astfel de problemă este exploatată superficial, surprinzându-se răzleţ câte un singur aspect. Ne propunem să dăm un model de analiză a implicaţiilor pe care le poate avea un rezultat cu aspect teoretic. Vom porni de la o problemă conţinută în culegerile de analiză matematică 1 1 şi anume convergenţa şirului cn = 1 + + K + − ln n , n ≥ 1 la constanta c a lui 2 n
207
Euler. Ea se încadrează într-un context general în care se foloseşte aceeaşi tehnică de demonstraţie. Să considerăm o funcţie derivabilă f : (a, ∞) → , unde a < 1 şi să definim şirul (an ) n ≥1 cu termenul general an = f ′(1) + f ′(2) + K + f ′(n) − f (n) . Ne punem problema convergenţei acestui şir. 5.3.1. Propoziţie. Dacă funcţia f : (a, ∞) → , unde a < 1 este derivabilă, cu derivata monotonă şi mărginită pe intervalul [1, ∞) atunci şirul (an ) n ≥1 cu termenul general an = f ′(1) + f ′(2) + K + f ′(n) − f (n) este convergent. Demonstraţie. Avem: an +1 − an = f ′(n + 1) − ( f (n + 1) − f (n)) = f ′(n + 1) − f ′(cn ) , unde cn ∈ (n, n + 1) din teorema lui Lagrange aplicată funcţiei f pe intervalul [n, n + 1] . Dacă f ′ este crescătoare, atunci f ′(n + 1) ≥ f ′(cn ) deci şirul (an ) n ≥1 este crescător, iar dacă f ′ este descrescătoare, atunci f ′(n + 1) ≤ f ′(cn ) de unde rezultă că şirul (an ) n ≥1 este descrescător. În primul caz avem: f ′(n) ≤ f ′(n + 1) − f ( n) ≤ f ′(n + 1) f ′(n − 1) ≤ f (n) − f (n − 1) ≤ f ′(n)
KKKKKKKKKKKKKK f ′(1) ≤ f (2) − f (1) ≤ f ′(2) Adunând aceste inegalităţi obţinem: f ′(1) − f (1) < an < f (n + 1) − f (n) = f ′(cn ) − f (1) ≤ M ′ − f (1)
{ f ′( x)
unde M ′ este un majorant pentru mulţimea
x ∈ [1, ∞)} .
În concluzie şirul (an ) n ≥1 este monoton şi mărginit, deci convergent. Celălalt caz se demonstrează la fel. 5. 3. 2. Observaţie. Dacă există limita lim f ′( x) = 1′ şi notăm cu x →∞
1 = lim an , atunci 1 ∈ [ f ′(1) − f (1),1′ − f (1)] . n →∞
5. 3. 3. Observaţie. Dacă funcţia f verifică ipotezele propoziţiei 5.3.1. f ′(1) + f ′(2) + K + f ′(n) =1. şi dacă lim f (n) = ∞ , atunci lim n →∞ n →∞ f (n) 5. 3. 4. Observaţie. Dacă pentru şirul din propoziţia 5.3.1. notăm lim an = a , atunci pentru un şir ( xn ) n ≥1 cu lim xn = +∞ se poate pune problema n →∞
n →∞
208
determinării limitei lim xn ⋅ ( f ′(1) + f ′(2) + K + f ′(n) − f (n) − a ) (dacă există), n →∞
care este o limită de tipul ∞⋅0 şi care în general se abordează cu criteriul lui 0 Stolz în cazul . 0 q (n)
5. 3. 5. Observaţie. Folosind secvenţe de forma
∑
f ′(k ) se obţin
k = p(n)
şiruri interesante a căror limită se determină folosindu-ne tot de propoziţia 5.3.1. n
Notând S n = ∑ f ′(k ) , avem: k =1
q (n)
∑
k = p(n)
f ′(k ) = S q ( n ) − S p ( n ) + f ′( p (n)) =
= ( S q ( n ) − f (q(n))) − ( S p ( n ) − f ( p(n)) − f ( p(n)) + f (q (n)) + f ′( p (n)) şi de aici q(n)
lim
n →∞
dacă p, q :
*
→
∑
k = p(n) *
f ′(k ) = lim( f (q (n)) − f ( p (n)) + f ′( p (n))) , n →∞
sunt funcţii strict crescătoare, cu p(n) < q(n) , (∀) n ∈
Bibliografie:
1. Ion Colojară, Analiză matematică, Editura Didactică şi Pedagogică, Bucureşti, 1983 2. Octavian Stănăşilă, Analiză matematică, Editura Didactică şi Pedagogică, Bucureşti, 1981 3. * * *, Teste grilă de matematică, - Admiterea 2003, U.T. Pres, ClujNapoca, 2002 4. * * *, Colecţia Gazetea Matematică 5. * * * , Colecţia “Argument” – Revista catedrei de matematică a Colegiului Naţional “Gheorghe Şincai” Baia Mare
209
*
.
Probleme rezolvate R5.4.1. Fie (an ) n ≥1 un şir de numere reale, convergent şi cu limita nenulă.
a) Să se arate că există N ∈ un unic xn ∈ cu proprietatea
astfel încât pentru orice n > N să existe
an +3 ⋅ 3xn + an + 4 ⋅ 4 xn = an +5 ⋅ 5xn (1) b) Să se arate că şirul ( xn ) n > N este convergent şi să se calculeze limita sa. Soluţie. Fie 1 = lim an , 1∈
*
n →∞
. Deoarece în relaţia (1) putem schimba
an cu − an , putem considera l > 0. a) Există N ∈
3 5 astfel încât an ∈ 1, 1 , (∀) n > N . Relaţia (1) se 4 4
poate scrie x
an +3 3 n an + 4 ⋅ + an +5 5 an + 5 (2) x
xn
4 ⋅ = 1 5 x
a 3 a 4 Funcţia f n : → , f n ( x) = n +3 ⋅ + n + 4 ⋅ este strict descrescătoare an +5 5 an +5 5 fiind sumă de funcţii strict descrescătoare. Evident fn este continuă. 3 2⋅ 1 an +3 + an + 4 6 f n (0) = ≥ 4 = >1 5 an +5 5 1 4 lim f n ( x) = 0 < 1 . n →∞
Există aşadar un unic xn ∈ (mai mult xn > 0 ) pentru care f n ( xn ) = 1 . a a b) Notând bn = n +3 şi cn = n + 4 , şirurile (bn ) n≥1 şi (cn ) n≥1 sunt an +5 an +5 x
x
n n 3 4 convergente la 1. Obţinem bn ⋅ + cn ⋅ = 1 şi de aici 5 5
210
x
x
x
x
n n n n 3 4 3 4 (bn − 1) ⋅ + (cn − 1) ⋅ + + = 1 . 5 5 5 5
x
x
n n 3 4 Cum lim(bn − 1) ⋅ = lim(cn − 1)〉 = 0 , rezultă n →∞ n →∞ 5 5 3 xn 4 xn lim + = 1 n→∞ 5 5 (3) Vom demonstra că şirul ( xn ) n ≥1 este convergent. Deoarece relaţia (3) este adevărată şi pentru orice subşir al şirului ( xn ) n ≥1 , rezultă că ( xn ) n ≥1 nu poate să aibă subşiruri nemărginite şi deci ( xn ) n ≥1 este
x
x
3 4 mărginit. În plus, deoarece funcţia f : → , f ( x) = + este 5 5 injectivă, şirul ( xn ) n ≥1 nu poate să admită două subşiruri convergente la numere reale distincte. Rezultă că ( xn ) n ≥1 este convergent. Din relaţia (3) deducem că ( xn ) n ≥1 este convergent la 2. R5.4.2. a) Demonstraţi că pentru fiecare n ∈ , n ≥ 2 , ecuaţia
1n⋅ x + 2n⋅ x + K + n n⋅ x e = n⋅ x n e −1 (*) are o unică rădăcină reală (notată xn). b) Demonstraţi că şirul ( xn ) n≥ 2 lim n ⋅ ( xn − 1) .
este convergent şi calculaţi
n →∞
Soluţie. a) (*) ⇔
1nx + 2nx + K + (n − 1) nx 1 = ⇔ nx n e −1 x
x
x
1 n 2 n n − 1 n 1 . ⇔ + + K + = e −1 n n n x
x
x
1 n 2 n n − 1 n Considerăm f n : → , f n ( x) = + + K + , fn este o n n n funcţie continuă strict descrescătoare (sumă de exponenţiale de bază subunitară) 1 1 . f n (0) = n − 1 ≥ 1 > , lim f n ( x) = 0 < e − 1 x →∞ e −1 Rezultă că ecuaţia (*) are o unică soluţie reală strict pozitivă.
211
Este cunoscută inegalitatea ln(1 − x) < − x , (∀) x ∈ (0,1) . n
k k Rezultă ln 1 − < − , k ∈ n n n
*
n
1 k , k < n şi de aici 1 − < k , k ∈ n e n
n
*
, k . kn nn Deducem inegalitatea loc
k +1 n +1
n +1
x
n
k > , (∀) k ∈ n
*
x
, k < n. x
x
1 n +1 2 n +1 3 n +1 n n +1 f n +1 ( x) = + + + K + . n + 1 n + 1 n + 1 n + 1 Pentru x > 0 , aplicând inegalitatea (1) termenilor funcţiei fn+1, începând cu al doilea termen, obţinem: x
x
x
x
1 n +1 1 n 2 n n − 1 n f n +1 ( x) = + + + K + > f n ( x) n + 1 n n n
(2) 1 , din (2) deducem că pentru fiecare n ≥ 2 e −1 are loc f n ( xn ) > f n ( xn +1 ) şi cum fn este strict descrescătoare, rezultă xn < xn +1 . Şirul ( xn ) n ≥1 fiind strict crescător şi mărginit, este convergent la un număr real l ∈ (0, 1]. Deoarece f n +1 ( xn +1 ) = f n ( xn ) =
212
R5.4.3. Să se determine limita şirului (an ) n , 1 1 an = n 1 + + K + − ln n − a , n 2 1 1 unde a = lim1 + + K + − ln n . n →∞ n 2 1 1 1 Soluţie. Notăm cu xn = 1 + + K + − ln n − a şi cu yn = . Conform n n 2 criteriului lui Stolz avem 1 − ln(n + 1) + ln n xn xn +1 − xn 1 n + lim = lim = lim = n →∞ y n →∞ y n →∞ 1 1 n n +1 − yn − n +1 n 1 1 1 1 − − + − ln( x + 1) + ln x 2 ( x + 1) x +1 x 1 = lim x + 1 = lim = . x →∞ x →∞ 1 1 1 1 2 − − + x +1 x ( x + 1) 2 x 2 R5.4.4. Să se determine q ⋅n 1 lim ∑ , n →∞ k = p ⋅n k unde p, q sunt numere naturale 1 ≤ p < q . Soluţie. Fie (an ) n un şir de numere reale, S n = a1 + a2 + K + an şi (bn ) n un şir cu proprietatea că şirul ( Sn − bn ) n este convergent. Dacă ( pn ) n şi (qn ) n sunt două şiruri de numere naturale pn ≤ qn , n ∈ atunci: qn
∑a
k = pn
k
= Sqn − S pn + a pn = ( Sqn − bqn ) − ( S pn − bpn ) + (bqn − bpn ) + a pn . qn
Deci lim ∑ ak = lim(bqn − bpn + a pn ) . n →∞
k = pn
n →∞
1 , pn = p ⋅ n , qn = q ⋅ n , bn = ln n obţinem k q ⋅n 1 1 q lim ∑ = lim ln q ⋅ n − ln p ⋅ n + = ln . n →∞ n →∞ p⋅n p k = p ⋅n k
Pentru ak =
q ⋅n
R5.4.5. Să se arate că lim
n →∞
π
q
∑ sin k = π ln p .
k = p ⋅n
213
Soluţie. Fie xn =
sin min
π k
q ⋅n
π
q ⋅n
sin
q ⋅n
1 k . Avem: ⋅ 1 k k = p ⋅n k
∑ sin k = ∑
k = p ⋅n
1
∑ k ≤x
n
≤ max
sin
p ⋅n ≤ k ≤ q ⋅n 1 k = p ⋅n 1 k k Trecând la limită cu n → ∞ rezultă p ⋅ n ≤ k ≤ q ⋅n
π
π
k
lim xn = π ⋅ ln n →∞
214
q ⋅n
1
∑k.
k = p⋅n
q . p
6. Proprietatea lui Darboux 6.1. Funcţii cu proprietatea lui Darboux. Generalităţi 6.1.1. Definiţie Fie I ⊆ R un interval şi f : I → R o funcţie. Spunem că f are Proprietatea lui Darboux (prescurtat P.D.) dacă ∀ a, b ∈ I , a < b şi oricare ar fi γ cuprins între f (a) şi f (b) există c ∈ (a, b) astfel încât f (c) = γ . 6.1.2. Observaţii a) Funcţia f : I → R are P.D. ⇔ ∀ a, b ∈ I , a < b şi ∀ λ ∈(0,1) ∃ c ∈ (a, b) astfel încât f (c) = (1 − λ ) f (a ) + λf (b) b) Funcţia f : I → R are P.D. ⇔ ∀ a, b ∈ I , a < b şi ∀ γ cuprins între f (a) şi f (b) , paralela la axa Ox care trece prin punctul (0, γ ) intersectează graficul lui f în cel puţin un punct ( x, f ( x)) cu x ∈ (a, b) c) Punctul c din definiţie nu este întotdeauna unic determinat. Pot exista o infinitate de puncte c ∈ (a, b) astfel încât f (c) = γ d) Fie f : I → R o funcţie cu proprietatea: ∀ a, b ∈ I , a < b şi oricare ar fi γ cuprins între f (a) şi f (b) există c ∈ I astfel încât f (c ) = γ . De aici nu rezultă numaidecât că f are P.D., ci doar faptul că f (I ) este un interval. De multe ori definiţia P.D. este destul de greu de utilizat. De aceea vom enunţa următoarea propoziţie: 6.1.3. Propoziţie Fie I ⊆ R un interval şi f : I → R o funcţie. Funcţia f are P.D. dacă şi numai dacă ∀ J ⊆ I un interval ⇒ f (J ) este interval Demonstraţie (⇒) Fie J ⊆ I un interval. Fixăm y1 , y 2 ∈ f ( J ) , y1 < y 2 şi y1 < λ < y 2 . Evident există x1 , x2 ∈ J astfel încât f ( x1 ) = y1 şi f ( x2 ) = y 2 . Conform definiţiei P.D. există x0 între x1 şi x2 astfel încât f ( x0 ) = λ ∈ f ( J ) . Deci ∀ y1 , y 2 ∈ f ( J ) rezultă că [ y1 , y2 ] ⊆ f ( J ) . De aici rezultă că f (J ) este un interval. (⇐) 215
Fie a, b ∈ I , a < b şi γ cuprins între f (a ) şi f (b) . Întrucât f ([a, b]) este un interval şi f (a), f (b) ∈ f ([a, b]) , rezultă că γ ∈ f ([a, b]) , deci există c ∈ [a, b] astfel încât f (c ) = γ . 6.1.4. Exemple Care dintre funcţiile următoare au P.D. ? − 1, x < 0 a) f : R → R , f ( x) = sgn( x) = 0, x = 0 1, x > 0
x, x ≤ 0 b) f : R → R , f ( x) = 1 − x, x > 0 0, x ∈ Q c) f : R → R , f ( x) = 1, x ∈ R \ Q x, x ∈ Q d) f : [0,1] → R , f ( x) = 3 x , x ∉ Q Soluţii a) f ([−1,1]) = {−1,0,1} care nu este interval, deci f nu are P.D. 1 1 1 1 1 1 b) f − , = f − ,0 ∪ f 0, = − ,0 ∪ ,1 care nu este 2 2 2 2 2 2 interval, deci f nu are P.D. c) f ([0,1]) = {0,1} care nu este interval, deci f nu are P.D. 1 1 d) Fie J = , . Arătăm că f (J ) nu este interval. Într-adevăr: 3 2 1 1 f ( J ∩ Q) = X ⊆ , 3 2 1 1 f ( J \ Q) = Y ⊆ , 27 8 Deci f (J ) = X ∪ Y şi X ∩Y = ∅, de unde rezultă că f (J ) nu este interval. Deci f nu are P.D.
6.1.5. Observaţii a)Din exemplul 6.1.4 b) se observă că există funcţii surjective care nu au P.D. b) S-a arătat la exemplele 6.1.4 c) şi d) că cele două funcţii de tip Dirichlet nu au P.D. Se poate da un rezultat mai general (vezi P 6.4.5)
216
6.1.6. Propoziţie Fie I ⊆ R un interval şi f : I → R o funcţie injectivă cu P.D. Atunci f este monotonă Demonstraţie Fie x1 , x2 , x3 ∈ I , x1 < x2 < x3 fixaţi. Atunci J 1 := f ([ x1 , x2 ]) şi J 2 = f ([ x2 , x3 ]) sunt intervale. Cum f ( x2 ) ∈ J 1 ∩ J 2 şi f este injectivă rezultă că J 1 ∩ J 2 = { f ( x2 )} . Aşadar f ( x1 ) < f ( x2 ) < f ( x3 ) sau f ( x3 ) < f ( x2 ) < f ( x1 ) , prin urmare f este strict monotonă. 6.1.7. Corolar Fie I ⊆ R un interval şi f : I → R o funcţie cu P.D. Atunci f este strict monotonă ⇔ f este injectivă 6.1.8. Propoziţie Fie I ⊆ R un interval şi f : I → R o funcţie cu P.D.. Dacă mulţimea f ( I ) este cel mult numărabilă, atunci f este constantă. Demonstraţie Deoarece f are P.D. rezultă că f ( I ) este un interval. Cum f ( I ) este cel mult numărabilă şi un interval care nu se reduce la un punct este echipotent cu R, deci nenumărabil, rezultă că f ( I ) se reduce la pun punct. Aşadar, există c ∈ R astfel încât f (I ) = {c} , deci f este constantă 6.1.9. Corolar Fie I ⊆ R un interval şi f : I → R o funcţie cu P.D. care se anulează cel puţin într-un punct. Dacă mulţimea f (I ) este cel mult numărabilă, atunci f = 0 . 6.1.10. Propoziţie Fie I ⊆ R un interval şi f : I → R o funcţie cu P.D. care nu se anulează în nici un punct. Atunci f > 0 sau f < 0 . Demonstraţie Presupunem că există a, b ∈ I cu f (a) < 0 şi f (b) > 0 . Atunci γ = 0 ∈ ( f (a ), f (b) ) , deci există c cuprins între a şi b astfel încât f (c) = 0 contradicţie. Rămâne că f > 0 sau f < 0
217
6.1.11. Corolar Fie I ⊆ R un interval şi f : I → R o funcţie cu P.D. Dacă a, b ∈ I , a < b şi f (a) ⋅ f (b) < 0 , atunci există c ∈ (a, b) astfel încât f (c) = 0 . 6.2. Clase de funcţii cu proprietatea lui Darboux 6.2.1. Teoremă (Bolzano) Fie I ⊆ R un interval şi f : I → R o funcţie continuă. Atunci f (I ) este un interval. Demonstraţie Fie y1 , y 2 ∈ J := f (I ) , y1 < y 2 şi y1 < λ < y 2 , fixaţi. Evident există a, b ∈ I cu f (a ) = y1 şi f (b) = y 2 . Presupunem a < b . Considerăm mulţimea A := {x ∈ [a, b] : f ( x) ≤ λ } şi fie c = sup A . Din definiţia marginii superioare rezultă că există ( xn ) n≥1 ⊆ A cu xn → c , deci f ( xn ) ≤ λ , (∀) n ≥ 1 . Cum f este continuă, avem f (c) = lim f ( xn ) ≤ λ . Deoarece λ < f (b) , avem c < b. n →∞
Evident f (x) > λ , (∀) c ∈ (c, b] . Fie ( y n ) n.1 ⊆ (c, b) , y n → c . Atunci
f ( y n ) > λ , (∀) n ≥ 1 , deci f (c) = lim f ( y n ) ≥ λ . Din f (c) ≤ λ şi f (c) ≥ λ , n →∞
deducem că f (c) = λ , deci λ ∈ J . Aşadar [ y1 , y 2 ] ⊆ J , (∀) y1 , y 2 ∈ J . Deci J este un interval. 6.2.2. Corolar Fie I ⊆ R un interval şi f : I → R o funcţie continuă. Atunci f are P.D. Demonstraţie Fie J ⊆ I un interval. Atunci conform Teoremei 6.2.1 f (J ) este un interval, deci conform Propoziţiei 6.1.3, f are P.D. 6.2.3. Corolar Fie I ⊆ R un interval şi f : I → R o funcţie continuă. Atunci: i) dacă f (I ) ⊆ R * ⇒ f > 0 sau f < 0 ii) dacă există a, b ∈ I , a < b astfel încât f (a) ⋅ f (b) < 0 ⇒ există c ∈ (a, b) astfel încât f (c) = 0 iii) f strict monotonă ⇔ f injectivă Demonstraţie i) şi ii) rezultă din P 6.1.10 şi C 6.1.11, iii) rezultă din C 6.1.7
218
6.2.4. Exemple
Funcţiile polinomiale, sin, cos, 1R , ⋅ , exp, ln au toate P.D. În continuare vom da caracterizări ale punctelor de discontinuitate pentru funcţii cu P.D. 6.2.5. Teoremă Fie I ⊆ R un interval, a = inf I , b = supI şi f : I → R o funcţie cu P.D. Atunci (∀) x0 ∈ I \ {a} (respectiv I \ {b} ), (∃) xn ∈ I , xn x0 (respectiv
xn x0 ) astfel încât f ( xn ) → f ( x0 ) Demonstraţie Fie x0 ∈ I \ {a} fixat şi rn 0 cu proprietatea că I n := ( x0 − rn , x0 ) ⊆ I , (∀)n ≥ 1 . Deoarece f are P.D. rezultă (P 6.1.3) că f ( I n ) şi f ( I n ∪ {x0 }) sunt intervale, evident care diferă între ele cel mult prin punctul y0 := f ( x0 ) . Atunci ∀n ≥ 1 , avem că y 0 ∈ f ( I n ) sau y0 este un capăt al lui f ( I n ) , deci (∃) y n ∈ f ( I n ) cu 1 y n − y 0 < şi fie xn ∈ I n cu f ( xn ) = y n . Cum avem x0 − rn < xn şi n 1 f ( xn ) − f ( x0 ) < deducem că xn → x0 şi f ( xn ) → f ( x0 ) . Extragem mai n departe un subşir strict crescător al şirului ( xn ) n≥1 şi evident acesta are proprietatea din enunţ. 0
În continuare vom nota cu I = int I = {x0 ∈ I / ∃V ∈V ( x0 ) : V ⊆ I } interiorul lui I 6.2.6. Corolar 0
Fie I ⊆ R un interval şi f : I → R o funcţie cu P.D. Atunci (∀) x0 ∈ I x0 şi yn (∃) xn , y n ∈ I \ {x0 } , xn lim f ( xn ) = lim f ( y n ) = f ( x0 ) n →∞
x0 astfel încât:
n →∞
6.2.7. Corolar Fie I ⊆ R un interval, a = inf I , b = sup I şi f : I → R o funcţie cu P.D. Dacă x0 ∈ I \ {a} (respectiv I \ {b}) şi f ( x0− ) (respectiv f ( x0+ ) ) există, atunci
f ( x0 ) = f ( x0− ) (respectiv f ( x0 ) = f ( x0+ ) ) deci f nu are discontinuităţi de speţa I
219
Demonstraţie Din P 6.2.5 rezultă că (∃) xn ∈ I \ {x0 } , xn
x0 cu f ( xn ) → f ( x0 ) . Deoarece
f ( x0− ) există, avem f ( xn ) → f ( x0− ) şi cum limita unui şir din R este unică,
deducem că f ( x0 ) = f ( x0− ) . 6.2.8. Corolar Fie I ⊆ R un interval şi f : I → R o funcţie monotonă, cu P.D. Atunci f este continuă pe I. Demonstraţie Din Corolarul 6.2.7 rezultă că f nu are discontinuităţi de speţa I, iar întrucât o funcţie monotonă nu are discontinuităţi de speţa a doua ([1] pag. 169, T 5.5.18, Cor 2), rezultă că F este continuă pe I.
Pentru Teorema 6.2.5 se poate formula o reciprocă: 6.2.9. Teoremă 0
Fie I ⊆ R un interval, x0 ∈ I şi f : I → R o funcţie continuă pe I \ {x0 } . Dacă i) (∃) xn ∈ I , xn
x0 astfel încât f ( xn ) → f ( x0 )
x0 astfel încât f ( y n ) → f ( x0 ) ii) (∃) y n ∈ I , yn atunci f are P.D. Demonstraţie: Fie ε > 0 astfel încât J ε = [ x0 , x0 + ε ] ⊆ I f ( J ε ) = { f ( x0 )}∪ f (( x0 , x0 + ε ]) Din (ii) rezultă că (∃) N ε ∈ N astfel încât y n ∈ ( x0 , x0 + ε ] , (∀)n ≥ N ε şi deci f ( y n ) ∈ f (( x0 , x0 + ε ]) , (∀)n ≥ N ε
Întrucât f este continuă pe ( x0 , x0 + ε ] avem că f ( ( x0 , x0 + ε ]) = Iε este un interval care conţine şirul convergent ( f ( y n ) )n≥ Nε .
Avem aşadar lim f ( yn ) = f ( x0 ) ∈ I ε şi deci f ( J ε ) = { f ( x0 )} ∪ I ε este tot un n→∞
interval. Analog se demonstrează că pentru (∀)δ > 0 , f ([ x0 − δ , x0 ] ∩ I ) este un interval. Deci (∀) J ⊆ I un interval avem: - dacă x0 ∉ J ⇒ f (J ) este un interval (întrucât f este continuă pe I \ {x0 } )
220
- dacă x0 ∈ J ⇒ ∃ ε , δ > 0 astfel încât J = [ x0 − δ , x0 + ε ] şi f ( J ) = f ([ x0 − δ , x0 ]) ∪ f ([ x0 , x0 + ε ]) este o reuniune de două intervale care au un punct comun, pe f ( x0 ) , deci şi reuniunea lor va fi un interval. 6.2.10. Corolar 0
Fie I ⊆ R un interval, x0 ∈ I şi f : I → R o funcţie continuă pe I \ {x0 } . Atunci f are P.D. dacă şi numai dacă: x0 astfel încât f ( xn ) → f ( x0 ) (i) (∃) xn ∈ I , xn x0 astfel încât f ( y n ) → f ( x0 ) (ii) (∃) y n ∈ I , yn Demonstraţie (⇒) se aplică T. 6.2.5 (⇐) se aplică T. 6.2.9 6.2.11. Corolar Fie f : [a, b] → R continuă pe (a, b] (respectiv [a, b) ). Atunci f are P.D. dacă şi numai dacă: (∃) xn ∈ (a, b] , xn a astfel încât f ( xn ) → f (a)
(∃) y n ∈ [a, b) , xn
b astfel încât f ( y n ) → f (b) )
6.2.12. Observaţii a) Teorema 6.2.9 dă o caracterizare a punctelor de discontinuitate de speţa a II-a pentru funcţii cu P.D. b) Teorema 6.2.9 se poate extinde pentru o funcţie f : I → R discontinuă pe o mulţime finită de puncte cu proprietăţile (i) şi (ii) c) Lebesgue a demonstrat că există funcţii f : R → R discontinue pe R şi care au P.D. (demonstraţia depăşeşte cadrul acestui manual) 6.2.13. Probleme rezolvate
1 sin , x ≠ 0 a) Funcţia f : R → R , f ( x) = x , α ∈ R are P.D. ⇔ α ≤ 1 α , x = 0
221
1 , x ≠ 0 , α ∈ R , unde (t) este distanţa de la t b) Funcţia f : R → R , f ( x) = x α , x = 0 1 la cel mai apropiat întreg are P.D. ⇔ α ∈ 0, 2 Soluţii a) f este continuă pe R \ {0} . Atunci conform Corolarului 6.2.10, f are P.D. dacă şi numai dacă (∃) x n ∈ R , xn 0 astfel încât f ( xn ) → α şi (∃) y n ∈ R , 1 0 astfel încât f ( y n ) → α . Întrucât sin ∈ [−1,1] , (∀) x ∈ R * , rezultă că yn x dacă α >1 atunci (∀) xn 0 , f ( xn ) →α şi (∀) yn 0 , f ( yn ) → α , deci f nu are P.D. Dacă α ≤ 1 , considerăm şirurile xn = respectiv yn =
1 arcsin α + 2nπ
1 arcsin α − 2nπ
0 şi f ( xn ) → α ,
0 şi f ( y n ) → α . Conform T. 6.2.9, f are P.D.
1 x ∈ k , k + x − k , 2 este continuă b) Funcţia g : R → R , g ( x) = ( x ) = 1 (k + 1) − x, x ∈ k + , k + 1 2 * pe R, deci f este continuă pe R . Atunci conform Corolarului 6.2.10 f are P.D. ⇔ (∃) xn ∈ R , xn 0 astfel încât f ( xn ) → α şi (∃) y n ∈ R , yn
0 astfel încât f ( y n ) → α
1 1 1 Întrucât ∈ 0, , ∀ x ∈ R* , rezultă că dacă α ∉ 0, atunci (∀) xn x 2 2 f ( xn ) →α şi (∀) yn 0 , f ( yn ) → α . 1 1 Dacă α ∈ 0, , considerăm şirurile xn = 0 şi α −n 2 1 f ( xn ) = (α − n) = α → α , respective yn = 0 şi α +n f ( y n ) = (α + n) = α → α . Conform T. 6.2.9, f are P.D.
222
0,
6.2.14. Teoremă Fie I ⊆ R un interval şi f : I → R o funcţie derivabilă. Atunci funcţia f ' are P.D. Demonstraţie Fie a, b ∈ I , a < b şi λ cuprins între f ' (a) şi f ' (b) fixaţi. Presupunem f ' (a) < f ' (b) , deci f ' ( a ) < λ < f ' (b) . Considerăm funcţia ϕ : I → R , ϕ ( x) = f ( x) − λx . Evident ϕ este derivabilă şi avem ϕ ' ( x) = f ' ( x) − λ , x ∈ I . Deci ϕ ' (a) = f ' (a) − λ < 0 şi ϕ ' (b) = f ' (b) − λ > 0 . Deoarece ϕ ( x) − ϕ (a ) ϕ ( x) − ϕ (b) = ϕ '(a ) < 0 , lim = ϕ '(b) > 0 , rezultă că (∃) lim x a x b x−a x−b ϕ ( x) − ϕ (a ) c, d ∈ (a, b), c < d cu proprietăţile: < 0 , (∀) x ∈ (a, c) şi x−a ϕ ( x) − ϕ (b) > 0 , (∀) x ∈ (d , b) , deci ϕ ( x) < ϕ (a) , (∀) x ∈ (a, c) şi ϕ ( x) < ϕ (b) , x−b (∀) x ∈ (d , b) (1) Funcţia ϕ fiind continuă şi [a, b] un interval compact, rezultă că ϕ îşi atinge minimul într-un punct x0 ∈ [a, b] . Din (1) rezultă că x0 ≠ a şi x0 ≠ b , deci 0
x0 ∈ (a, b) şi deci x0 ∈ I . Aşadar x0 este un punct de minim local pentru ϕ, deci conform teoremei lui Fermat avem ϕ ' ( x0 ) = 0 , deci f ' ( x0 ) = λ . Prin urmare f ' are P.D. 6.2.15. Corolar Fie I ⊆ R un interval şi f : I → R o funcţie derivabilă cu proprietatea că f ' ( x) ≠ 0 , (∀) x ∈ I . Atunci f este strict monotonă. Demonstraţie Din Teorema 6.2.14 avem că f ' are P.D., deci (P. 6.1.10) f '> 0 sau f '< 0 şi deci f este strict monotonă. 6.2.16. Observaţie Rezultatul Teoremei 6.2.14 este deosebit de util în studiul primitivabilităţii funcţiilor (care se va studia în clasa a XII-a)
223
6.3. Păstrarea P.D. asupra funcţiei sumă, produs, cât, compunere a două funcţii cu P.D. 6.3.1. Observaţie Există funcţii f , g : R → R care au P.D., pentru care funcţia sumă f + g , produs f ⋅ g , respectiv cât f ( g ( x) ≠ 0 , ∀ x ∈ R ) nu au P.D. g Demonstraţie a) Sumă 1 1 sin , x ≠ 0 − sin , x ≠ 0 Într-adevăr, fie f , g : R → R , f ( x) = x , g ( x) = x 0, x=0 x=0 1,
0, x ≠ 0 f şi g au P.D., dar f + g : R → R , ( f + g )( x) = are o discontinuitate de 1, x = 0 speţa I, deci nu are P.D. b) Produs 1 1 sin , x ≠ 0 cos , x ≠ 0 Fie f , g : R → R , f ( x) = x , g ( x) = . x 1, x=0 x=0 1, 2 1 sin , x ≠ 0 f şi g au P.D., dar f ⋅ g : R → R , ( f ⋅ g )( x) = 2 nu are PD întrucât x 1, x=0 1 2 1 1 f ⋅ g este continuă pe R * , sin ∈ − , şi (∀) xn 0 , ( f ⋅ g )( xn ) → 1 şi 2 x 2 2 (∀) yn 0 , ( f ⋅ g )( y n ) → 1 c) Cât 1 1 sin , x ≠ 0 sin + 2, x ≠ 0 Fie f , g : R → R , f ( x) = x , g ( x) = x 1, 2, x=0 x=0
f are P.D., g este continuă pe R * , şi considerând şirurile xn =
−1 nπ
0,
1 0 , g ( y n ) = 2 → 2 obţinem (conform Corolarului nπ 6.2.10) că g are P.D. Se observă că g ( x) ≠ 0 , (∀) x ∈ R
g ( xn ) = 2 → 2 şi yn =
224
1 sin x ,x ≠ 0 1 f f f : R → R , ( x ) = sin + 2 este continuă pe nu are P.D. întrucât x g g g 1 x=0 2 , 1 sin f 2 1 1 1 x = 1− 0 , ( xn ) → R* , ∈ − 1, şi (∀) xn ∉ − 1, şi / 1 1 g 3 2 3 sin + 1 sin + 2 x x f 1 (∀) yn 0 , ( yn ) → / . 2 g Este de asemenea cunoscut următorul rezultat pe care îl vom prezenta aici fără demonstraţie : 6.3.2. Teoremă (Sierpinski) Fie f : R → R o funcţie arbitrară. Atunci există f1 , f 2 : R → R două funcţii discontinue pe R şi care au P.D. astfel încât f = f1 + f 2 6.3.3. Teoremă Fie A şi B ⊆ [a, b] două mulţimi finite disjuncte şi f , g : [a, b] → R două funcţii cu următoarele proprietăţi : a) f este continuă pe [a, b] \ A şi discontinuă pe A cu P.D. b) g este continuă pe [a, b] \ B şi discontinuă pe B cu P.D. Atunci f + g şi f ⋅ g au P.D. Demonstraţie f + g şi f ⋅ g sunt continue pe [a, b] \ ( A ∪ B) . Fie x0 ∈ A ∪ B , A ∩ B = 0/ . Atunci x0 ∈ A \ B sau x0 ∈ B \ A . Să presupunem că x0 ∈ A \ B şi x0 ∈ (a, b) . Atunci conform Corolarului 6.2.10 : (i) (∃) xn ∈ [a, b] , xn x0 astfel încât f ( xn ) → f ( x0 )
(ii) (∃) y n ∈ [a, b] , yn y0 astfel încât f ( y n ) → f ( x0 ) Avem: ( f + g )( xn ) = f ( xn ) + g ( xn ) → f ( x0 ) + g ( x0 ) = ( f + g )( x0 ) întrucât f ( xn ) → f ( x0 ) şi g continuă în x0 , deci şi g ( xn ) → g ( x0 ) Analog ( f + g )( y n ) → ( f + g )( x0 ) Conform Corolarului 6.2.10 avem ( f + g ) are P.D. Analog se arată că ( f ⋅ g ) are P.D.
225
6.3.4. Corolar Fie A ⊆ [a, b] o mulţime finită şi f , g : [a, b] → R două funcţii cu următoarele proprietăţi: a) f continuă pe [a, b] b) g continuă pe [a, b] \ A şi discontinuă pe A. Atunci următoarele afirmaţii sunt echivalente: 1) g are P.D. 2) f + g are P.D. De asemenea 1) ⇒ 3) şi dacă în plus f ( x) ≠ 0 , (∀) x ∈ A atunci 1) este echivalentă cu 3) 3) f ⋅ g are P.D. Demonstraţie 1) ⇒ 2) conform T 6.3.3 2) ⇒ 1) f continuă pe [a, b] atunci (− f ) este continuă pe [a, b] şi f + g continuă pe [a, b] \ A şi are P.D., atunci (− f ) + ( f + g ) = g are P.D. (conform T 6.3.3) 1) ⇒ 3) conform T 6.3.3 3) ⇒ 1) f continuă pe [a, b] , f ( x) ≠ 0 , ∀ x ∈ A , f ⋅ g continuă pe [a, b] \ A şi are P.D. Fie x0 ∈ A . Putem presupune că x0 ∈ (a, b) . Atunci, conform Corolarului 6.2.10: x0 astfel încât ( f ⋅ g )( xn ) → ( f ⋅ g )( x0 ) (∃) xn ∈ [a, b] , xn
(∃) y n ∈ [a, b] , yn x0 astfel încât ( f ⋅ g )( y n ) → ( f ⋅ g )( x0 ) Întrucât f ( x0 ) ≠ 0 şi f continuă în x0 rezultă că (∃) V ∈V ( x0 ) astfel încât f ( x) ≠ 0 , (∀) x ∈V şi deci (∃)N∈N astfel încât (∀) n ≥ N: xn ∈ V , de unde f ( xn ) ≠ 0 , ∀n ≥ N ( f ⋅ g )( xn ) ( f ⋅ g )( x0 ) → = g ( x0 ) Avem g ( xn ) = f ( xn ) f ( x0 ) Analog se demonstrează că g ( y n ) → g ( x0 ) şi conform Corolarului 6.2.10 avem că g are P.D. 6.3.5. Propoziţie Fie I , J ⊆ R două intervale şi f : I → J , g : J → R două funcţii care au P.D. Atunci g o f are P.D. Demonstraţie Fie J ⊆ I un interval, ( g o f )( I ) = g ( f ( I )) = g ( I ' ) = I ′′ unde I ' şi I ′′ sunt intervale întrucât f, respectiv g au P.D. Deci g o f are P.D.
226
6.3.6. Corolar
Fie I ⊆ R un interval şi f : I → R o funcţie cu P.D. Atunci f are P.D. 6.3.7. Corolar Fie I , J ⊆ R două intervale şi f : I → J , g : J → R două funcţii, una continuă şi cealaltă având P.D. Atunci g o f are P.D.
Bibliografie
[1] Gh. Sireţchi, „Calcul diferenţial şi integral”, vol. I şi II, Editura Ştiinţifică şi Enciclopedică, Bucureşti, 1985 [2] Gh. Sireţchi, „Funcţii cu Proprietatea lui Darboux”, Materiale pentru perfecţionarea profesorilor de liceu, vol. IV (partea a II-a), Univ. Bucureşti, Fac. de Matematică, 1993 [3] W.W. Breckner, „Funcţii cu Proprietatea lui Darboux”, Did. Matem. 19861987, 34-37 [4] Z. Finta, „Din nou despre Proprietatea lui Darboux”, Did. Matem. vol. 51/2000, 39-50 [5] I. Magdaş, „O condiţie suficientă pentru ca suma (produsul) a două funcţii să aibă Proprietatea lui Darboux”, Did. Matematicii, vol. 14/2000, 181-186 [6] O. Konnerth, „Greşeli tipice în învăţarea analizei matematice”, Ed. Dacia, Cluj-Napoca, 1982 Indicaţii şi relaţii: (6.4. – cls. XI – Analiză) P. 6.4.1. a) continuă ⇒ are P.D. b) continuă ⇒ are P.D. c) f are discontinuităţi de speţa I ⇒ f nu are P.D. d) vezi exemplul 6.1.4. d) şi P. 6.4.5 e) f are P.D. ⇔ a ∈ [−1,1]
f) f are P.D., (∀) a ∈ R (f continuă pe (0, ∞) , xn = f ( xn ) → a )
227
1 a arcsin + 2nπ 2nπ
0,
g) f are P.D. ⇔ a ≤ p h) dacă p > 0, f are P.D. ⇔ a = 0 dacă p = 0, f are P.D. ⇔ a ∈ [−1,1] dacă p < 0, f are P.D. (∀) a ∈ R x 1 ,x ≠ 0 1 sin , x ≠ 0 1 − 2 x continuă, h( x) = x continuă pe i) f = g ⋅ h , g ( x) = x 1 − − ln 2 ⋅ a, x = 0 ln 2 , x = 0 R * , are P.D. ⇒ f are P.D. 1 e1− x , x ≠ 0 cos , x ≠ 0 continuă, h( x) = j) f = g + h , g ( x) = continuă pe R * x e, x = 0 a − e, x = 0 f are P.D. ⇔ h are P.D. ⇔ a − e ≤ 1 ⇔ a ∈ [e − 1, e + 1] P. 6.4.2. A: a,c,d,f,h,i,j Contraexemple:
x, x ≤ 0 b) f : R → R , f ( x) = x + 1, x > 0 x≤0 x, e) f : R → R , f ( x) = − 1 − x , x > 0 x, x ∈ [0,1) g) f : [0,2] → R , f ( x) = , f ([0,2]) = [0,2] 3 − x, x ∈ [1,2] P. 6.4.3. (⇒) g ( R) = g ( R * ) ∪ {g (0)} = [−1,1] ∪ {α } ⇒ α ≤ 1 (⇐) Fie I ⊆ R un interval fixat. Distingem următoarele cazuri: 1 1) I ⊆ R+ . Atunci J := , x ∈ I este un interval şi avem g ( I ) = f ( J ) şi x întrucât f (J ) interval ⇒ g (I ) interval 1 2) 0 ∈ I ⊆ R+ şi I ≠ {0} . Atunci (∃) n0 ≥ 1 cu 0, ⊆ I , (∀) n ≥ n0 , deci n0 g ( I ) = {α } ∪ f ([n0 , ∞]) = {α } ∪ [−1,1] = [−1,1] 3) 0 ∈ I ⊆ R−* analog 2) 0
4) 0 ∈ I , folosim 2) şi 3) 228
P. 6.4.4.
g continuă pe R * , x = 0 este punct de discontinuitate de speţa a doua. Se consideră I ⊆ R un interval compact. Dacă I ⊆ R+* sau I ⊆ R−* , atunci g (I ) este un interval compact. Dacă 0 ∈ I şi I ≠ {0} se arată că g ( I ) = [−1,1] . 1 1 1 , ⊆ I şi deci Într-adevăr, dacă I ∩ R+* ≠ 0/ , (∃) n ∈ N par cu ∈ I , deci n n + 1 n 1 1 [−1,1] ⊇ g ( I ) ⊇ g , = f ([n, n + 1]) ⊇ [−1,1] , etc. n +1 n P. 6.4.5. (⇒) Fie x0 ∈ I şi presupunem că f ( x0 ) ≠ g ( x0 ) de exemplu f ( x0 ) < g ( x0 ) şi
fie γ = g ( x0 ) − f ( x0 ) > 0 . f, g continue în x0 ⇒ (∃) δ > 0 astfel încât
γ
γ
, (∀) x, y ∈ I ∩ ( x0 − δ , x0 + δ ) := J 3 3 γ γ h ( J ∩ Q ) = X ⊆ f ( x0 ) − , f ( x0 ) + ; 3 3 γ γ h ( J \ Q ) = Y ⊆ g ( x0 ) − , g ( x0 ) + 3 3 Deci h( J ) = X ∪ Y şi X ∩ Y = 0/ ⇒ h(J ) nu este un interval (⇐) dacă f = g , atunci h = f = g continuă ⇒ h are P.D. f ( x ) − f ( x0 )
0 x↑ x0 x − x0
f ( x) ≤ f ( x0 ), (∀) x ∈V .
că
f ( x ) − f ( x0 ) < 0 , deci f s' ( x0 ) ⋅ f d' ( x0 ) < 0 . x − x0 234
şi şi
7.1.4. Teoremă. Dacă funcţia f : I → R are în x0 interior intervalului I, derivate laterale finite nenule sau infinite, de semne contrare, atunci x0 este un punct de extrem şi anume dacă f d' ( x0 ) < 0 atunci x0 este un punct de maxim, iar dacă f s' ( x0 ) < 0 atunci x0 este un punct de minim 7.1.5. Exemplu. Să se determine extremele funcţiei f : R → R , f ( x) = 3 x 3 − 3 x 2 . Soluţie. f este continuă pe R, f ' ( x) =
x2 − 2x
, f este derivabilă pe ( x 3 − 3x 2 ) 2 R \ {0,3} . f s' (0) = +∞ , f d' (0) = −∞ , deci x = 0 este punct de maxim conform Teoremei 7.1.4, iar f ' (3) = ∞ deci 3 nu este punct de extrem conform Teoremei 7.1.3. 7.1.6. Problemă rezolvată. Arătaţi că există un singur număr real a > 0 cu proprietatea a x ≥ x + 1, (∀) x ∈ R . (W. Sierpinski) x Soluţie. Fie f : R → R , f ( x) = a − x . Se observă că f ( x) ≥ f (0), (∀) x ∈ R . Deci 0 este punct de minim global (deci şi local) pentru funcţia f. Aplicând teorema lui Fermat rezultă că f ' (0) = 0 . Dar f ' ( x) = a x ln a − 1 , deci f ' (0) = ln a − 1 = 0 ⇒ a = e . Se poate demonstra uşor că e x ≥ x + 1 , (∀) x ∈ R . 7.1.7. Problemă rezolvată. Fie a1 , a2 ,..., an ∈ R *+ astfel încât a1x + a2x + ... + anx ≥ n, (∀) x ∈ R . Atunci a1a2 ...an = 1 . (S. Rădulescu) x x x Soluţie. Fie f : R → R , f ( x) = a1 + a2 + ... + an . Evident f (0) = n şi f derivabilă. Deoarece f ( x) ≥ f (0), (∀) x ∈ R avem că 0 este punct de minim pentru f. Atunci din teorema lui Fermat rezultă că f ' (0) = 0 . Însă f ' ( x) = a1x ln a1 + a2x ln a2 + ... + anx ln an deci f ' (0) = ln a1 + ln a2 + ... + ln an = ln(a1a2 ...an ) iar f ' (0) = 0 ⇔ a1a2 ...an = 1 . 3
7.2. Teorema lui Rolle 7.2.1. Teoremă (Rolle). Fie a, b ∈ R , a < b şi f : [a, b] → R o funcţie cu proprietăţile: 1) f continuă pe [a, b] , 2) f derivabilă pe (a, b) şi 3) f (a) = f (b) . 235
Atunci există cel puţin un punct x0 ∈ (a, b) pentru care f ' ( x0 ) = 0 . 7.2.2. Observaţii. (i) O funcţie care satisface condiţiile 1) şi 2) se numeşte funcţie Rolle. (ii) Dacă în particular f (a) = f (b) = 0 , teorema lui Rolle afirmă că între două rădăcini a şi b ale unei funcţii derivabile există cel puţin o rădăcină a derivatei sale. (iii) În teorema lui Rolle condiţia f derivabilă pe (a, b) poate fi înlocuită cu una mai slabă, şi anume: "f are derivată pe (a, b) ", întrucât demonstraţia, în care se aplică teorema lui Fermat, nu foloseşte faptul că derivata ar fi finită. (iv) Fiecare din condiţiile teoremei lui Rolle este fundamentală, în sensul că renunţând doar la una din cele trei condiţii nu mai rezultă concluzia. Într-adevăr f : [0,1] → R , f ( x) = x îndeplineşte doar condiţiile 1) şi 2) şi f ' ( x) ≠ 0, (∀) x ∈ [0,1] ; x 2 , x ∈ [0,1) f : [0,1] → R , f ( x) = îndeplineşte numai condiţiile 2) şi 3), f nu 0, x = 0 este continuă în x = 1 . Evident f ' ( x) ≠ 0 , (∀) x ∈ (0,1) ; f : [−1,1] → R , f ( x) =| x | îndeplineşte numai condiţiile 1) şi 3), f nu este derivabilă în x = 0 . Evident f ' ( x) ≠ 0, (∀) x ∈ (−1,1) \ {0} . (v) Ipotezele teoremei lui Rolle sunt suficiente, dar nu şi necesare pentru ca derivata să aibă cel puţin o rădăcină. Există chiar funcţii care nu satisfac nici una din condiţii pe un anumit interval pe care totuşi derivata se anulează. Astfel x 2 , x ∈ Q ∩ [0,1] pentru f ( x) = avem f ' (0) = 0 . 0, x ∈ [0,1] \ Q 7.2.3. Teorema lui Pompeiu. Fie funcţia Rolle f : [a, b] → R şi 0 ∉ [a, b] . Atunci există un punct c ∈ (a, b) astfel încât af (b) − bf (a ) = f (c) − cf ' (c). a −b f ( x) − λ Demonstraţie. Se consideră funcţia F : [a, b] → R , F ( x) = . x af (b) − bf (a) Vom determina λ ∈ R astfel încât F (a) = F (b) . Se obţine λ = . a −b Aplicând teorema lui Rolle rezultă că există c ∈ (a, b) astfel încât F ' (c) = 0 adică cf ' (c) − f (c) + λ = 0 . 7.2.4. Interpretarea geometrică a teoremei lui Pompeiu. Dreapta AB, unde A(a, f (a )), B(b, f (b)) ∈ G f întâlneşte axa Oy în punctul M (0, λ ) , unde
236
af (b) − bf (a) . Conform teoremei lui Pompeiu, există c ∈ (a, b) astfel încât a −b tangenta în punctul C (c, f (c)) ∈ G f la graficul funcţiei f, întâlneşte axa Oy în λ=
punctul M (fig. 7.1). B A
M
c
a
b
7.2.4. Problemă rezolvată. Fie ak , bk ∈ R , k = 1, n . Să se demonstreze că există x0 ∈ (0,2π) astfel încât n
∑ (a k =1
k
sin kx0 + bk cos kx0 ) = 0 .
Soluţie. Fie funcţia f : [0,2π) → R , n 1 f ( x) = ∑ (ak cos kx − bk sin kx) . k =1 k n 1 Evident f este derivabilă pe [0,2π] şi avem f (0) = f (2π) = ∑ ak k =1 k deci conform teoremei lui Rolle există x0 ∈ (0,2π) astfel încât f ' ( x0 ) = 0 . Dar n
f ' ( x) = −∑ (ak sin kx + bk cos kx) , deci k =1
n
− f ' ( x0 ) = ∑ (ak sin kx0 + bk cos kx0 ) = 0 . k =1
237
7.3. Teorema lui Lagrange 7.3.1. Teoremă (Lagrange). Fie a, b ∈ R , a < b şi funcţia f : [a, b] → R o funcţie Rolle. Atunci există un punct c ∈ (a, b) astfel încât f (b) − f (a) = (b − a) f ' (c) . 7.3.2. Observaţii. (i) Teorema lui Lagrange rămâne adevărată dacă înlocuim condiţia 1) cu 1'): f are proprietatea lui Darboux, sau 2) cu 2'): funcţia f are derivată finită sau infinită pe (a, b) . (ii) Teorema lui Lagrange ne asigură de existenţa punctului intermediar c, fără nici o precizare asupra unicităţii. (iii) Teorema lui Rolle este un caz particular al teoremei lui Lagrange, însă teorema lui Rolle nu poate fi considerată o consecinţă a teoremei lui Lagrange, deoarece în demonstraţia teoremei lui Lagrange se foloseşte chiar teorema lui Rolle. (iv) Dacă în locul intervalului [a, b] considerăm un interval de forma [ x0 , x0 + h] ⊆ [a, b] , formula lui Lagrange poate fi scrisă astfel: f ( x0 + h) − f ( x0 ) = f ' ( x0 + θh) ⋅ h , unde θ ∈ (0,1) f ( x0 + h ) − f ( x0 ) = f ' ( x0 + θh) , sau h de unde apare şi denumirea de "teorema creşterilor finite" care se foloseşte adesea în loc de teorema lui Lagrange. 7.3.3. Problemă rezolvată. Să se arate că dacă a şi b sunt numere pozitive, a < b , iar n ∈ N , atunci avem inegalităţile: n(b − a)a n−1 < b n − a n < n(b − a )b n−1 (Cauchy) Soluţie. Fie f : [a, b] → R , f ( x) = x n . Conform teoremei lui Lagrange, ∃c ∈ (a, b) astfel încât f (b) − f (a ) bn − an = f ' (c ) ⇔ = nc n−1 b−a b−a Din c ∈ (a, b) rezultă na n−1 < nc n−1 < nb n−1 , de unde obţinem: bn − an < nb n−1 . b−a 7.3.4. Problemă rezolvată. Să se demonstreze că şirul cu termenul 1 1 general an = 1 + + ... + − ln n este convergent, iar limita sa este un număr 2 n cuprins între 0 şi 1. (Euler) na n−1
0, (∀) x ∈ I . Dacă a = c rezultă g (b) = g (d ) de unde b = d . Analog, pentru b = d obţinem a = c . Tot fără restrângerea generalităii presupunem a < c , deci g (a) < g (c) de unde g (b) > g (d ) , adică b > d . Avem deci ordinea a < c ≤ d < b . Din relaţiile din enunţ rezultă f (a ) − f (c) f (d ) − f (b) = . g (a ) − g (c) g (d ) − g (b) Aplicând funcţiilor f şi g teorema lui Cauchy pe intervalele [a, c] şi [d , b] rezultă că există α şi β, α ∈ (a, c) , β ∈ (d , b) astfel încât f (d ) − f (b) f ( a ) − f (c ) = h(α) şi = h(β) . g ( a ) − g (c ) d −b De aici rezultă h(α) = h(β) şi cum h este injectivă avem α = β ceea ce contrazice inegalitatea α < β . Aşadar a = c şi b = d . Presupunând iniţial a ≤ b şi d ≤ c va rezulta a = d şi b = c . 7.4.5. Problemă rezolvată. Fie ABCD un dreptunghi şi λ ∈ R . Să se afle locul geometric al punctelor M din plan cu proprietatea: MAλ + MC λ = MB λ + MD λ (1) Soluţie. Are loc relaţia MA 2 + MC 2 = MB 2 + MD 2 (2) deci pentru λ = 2 locul geometric este tot planul. Dacă λ ≠ 2 atunci din (1) şi (2), aplicând problema 7.4.4 funcţiilor f , g : (0, ∞) → R , f ( x) = x λ şi g ( x) = x 2 , rezultă MA = MB şi MC = MD sau MA = MD şi MC = MB . Deci locul geometric este reuniunea celor 2 mediatoare ale segmentelor [ AB] şi [ BC ] .
7.4.4. Problemă rezolvată.
241
Bibliografie [1] D. Buşneag, I. Maftei, Teme pentru cercurile de matematică ale elevilor, Ed. Scrisul Românesc, Craiova, 1983. [2] V. Nicula, Analiză matematică, partea a II-a, Bucureşti, 1997. [3] V. Săseanu, S. Bîrsan, Teoremele de medie din analiza matematică, Ed. Radical, 1997. [4] I. Gligor, Câteva observaţii asupra predării graficelor, GMA 3/66, pg.95. [5] Gh. Schneider, Culegere de probleme de analiză matematică pentru clasele XI-XII, Ed. Hyperion, 1997.
242
8. Funcţii convexe 8.1. Noţiuni teoretice 8.1.1. Definiţie. Mulţimea A ⊂ n se numeşte convexă dacă (∀) x, y ∈ A şi (∀) t ∈ [0,1] ⇒ (1 − t ) x + ty ∈ A , unde n = 14 × 4244 × K ×3 . n− ori
Exemple. este mulţime convexă; 1) 2) Dacă I ⊂ este interval, atunci I este mulţime convexă; 3) Mulţimea vidă este mulţime convexă; = × este mulţime convexă; 4) 5) Mulţimea A = [1, 2) U (3, 4) nu este mulţime convexă. Observaţie. Intersecţia a două mulţimi convexe este o mulţime convexă. 8.1.2. Definiţie. Fie I ⊂ un interval. O funcţie f : → se numeşte convexă pe I dacă (∀) x1 , x2 ∈ I şi (∀) t ∈ [0,1] avem: f ((1 − t ) x1 + tx2 ) ≤ (1 − t ) f ( x1 ) + t f ( x2 ) . (1) Dacă în (1) inegalitatea este strictă pentru t ∈ (0,1) şi x1 ≠ x2 vom spune că f este strict convexă pe I. Interpretare geometrică.
y B
f ( x2 )
(1 − t ) f ( x1 ) + t f ( x2 )
f (α ) f ( x1 )
A x1
0
α
x2
I
α = (1 − t ) x1 + t x2 , t ∈ [0,1] A( x1 , f ( x1 )) , B( x2 , f ( x2 )) , x1 ≠ x2 . Dacă A, B ∈ G f , α ∈ [ x1 , x2 ] , atunci ecuaţia coardei [AB] este
243
x
f ( x2 ) − f ( x1 ) ( x − x2 ) x2 − x1 şi ordonata punctului de abscisă α de pe această coardă va fi f ( x2 ) − f ( x1 ) [ (1 − t ) x1 + t x2 − x2 ] = β = f ( x2 ) + x2 − x1 = f ( x2 ) + (1 − t ) [ f ( x1 ) − f ( x2 )] = (1 − t ) f ( x1 ) + t f ( x2 ) , ceea ce se poate scrie f (α ) ≤ β şi înseamnă că graficul lui f este situat sub orice coardă care se obţine unind două puncte situate pe graficul funcţiei şi având abscisele aparţinând lui I. 8.1.3. Definiţie. Funcţia f se numeşte concavă pe I dacă −f este convexă pe I. Observaţii. a) Dacă f este concavă pe I, atunci în (1) inegalitatea este inversă. b) Funcţia f este strict concavă pe I dacă −f este strict convexă pe I. 8.1.4. Exemplu. Să se demonstreze, pe baza definiţiei că funcţia f : → , f ( x) = ax 2 + bx + c , a, b, c ∈ şi a > 0 , este convexă. Demonstraţie. Fie x1 , x2 ∈ oarecare. Fără să restrângem generalitatea putem presupune că x1 < x2 . Atunci, (∀) α ∈ [ x1 , x2 ] există t ∈ [0,1] astfel încât α = (1 − t ) x1 + t x2 , deoarece [ x1 , x2 ] este un interval şi deci o mulţime convexă. Avem: f (α ) = f ((1 − t ) x1 + tx2 ) = ax12 − 2atx12 + t 2 ax12 + at 2 x22 + +2atx1 x2 − 2at 2 x1 x2 + bx1 − btx1 + btx2 + c Pe de altă parte (1 − t ) f ( x1 ) + tf ( x2 ) = ax12 − atx12 + bx1 − btx1 + c − ct + + atx22 + btx2 + ct . Făcând diferenţa obţinem: f (α ) − [(1 − t ) f ( x1 ) + tf ( x2 )] = − at (1 − t )( x2 − x1 ) 2 . Cum a > 0 şi t ∈ [0,1] rezultă că: f ((1 − t ) x1 + tx2 ) ≤ (1 − t ) f ( x1 ) + tf ( x2 ) , adică f este convexă. Observaţie. Dacă a < 0 funcţia f este concavă. Aceasta rezultă imediat din faptul că − f ( x) = − ax 2 − bx − c este convexă. 8.1.5. Teoremă. (criteriu de convexitate). Fie I ⊆ un interval şi o funcţie de două ori derivabilă pe I. Funcţia f este convexă pe I f :I → dacă şi numai dacă f ′′( x) ≥ 0 pe I. y = f ( x2 ) +
244
Demonstraţie. Vom demonstra că teorema este adevărată pe orice interval de forma (a, b) ⊆ I , a < b şi în consecinţă pe I. “⇐” Dacă f ′′( x) ≥ 0 pe (a, b), atunci f ′( x) este crescătoare pe (a, b), deci (∀) α1 , α 2 ∈ (a, b) , α1 < α 2 ⇒ f ′(α1 ) ≤ f ′(α 2 ) . Fie t ∈ [0,1] şi x0 = ta + (1 − t )b . Avem a < x0 < b . Conform teoremei lui Lagrange există α1 ∈ (a, x0 ) şi α 2 ∈ ( x0 , b) astfel încât f ( x0 ) − f (a) f (b) − f ( x0 ) = f ′(α1 ) şi = f ′(α 2 ) . x0 − a b − x0 Cum α1 < α 2 ⇒ f ′(α1 ) ≤ f ′(α 2 ) , deci: f ( x0 ) − f (a) f (b) − f ( x0 ) ≤ . x0 − a b − x0 Înlocuind la numitori x0 prin ta + (1 − t )b şi grupând convenabil se ajunge la: f ( x0 ) ≤ f (a)t + f (b)(t − 1) ⇔ f (ta + (1 − t )b) ≤ tf (a) + (1 − t ) f (b) , adică f este convexă. “⇒” Presupunem că f este convexă pe (a, b) şi fie trei numere reale f ( β ) − f (α ) f (γ ) − f ( β ) ≤ . oarecare α < β < γ din (a, b). Vom demonstra că β −α γ −β γ −β β −α ∈ (0,1) . Avem 1 − t = Fie t = şi din f convexă rezultă γ −α γ −α γ − β β −α γ − β β −α ⋅α + ⋅γ ≤ f f (α ) + f (γ ) . γ −α γ −α γ −α γ −α După efectuarea calculelor avem: f ( β )(γ − α ) ≤ f (α )(γ − β ) + f (γ )( β − α ) sau f ( β )[(γ − β ) + ( β − α )] ≤ f (α )(γ − β ) + f (γ )( β − α ) ⇔ ⇔ [ f ( β ) − f (γ )]( β − α ) ≤ [ f (α ) − f ( β )](γ − β ) ⇔ f (γ ) − f ( β ) f ( β ) − f (α ) ⇔ ≥ . γ −β β −α Pentru oricare x1 , x2 ∈ (a, b) astfel încât x1 < α < x2 < β şi ţinând cont de (1) avem: f ( x2 ) − f (α ) f (α ) − f ( x1 ) f ( β ) − f ( x2 ) f ( x2 ) − f ( x1 ) ≥ şi ≥ . β − x2 x2 − α α − x1 x2 − x1
245
Dacă α → x1 şi β → x2 obţinem f ′( x2 ) ≥ f ′( x1 ) pentru că f ( x) este derivabilă şi cum alegerea lui x1 şi x2 este arbitrară, condiţionată numai de x1 < x2 , avem f ′( x2 ) − f ′( x1 ) ≥ 0 . Împărţind cu x2 − x1 > 0 , obţinem f ′( x2 ) − f ′( x1 ) ≥0. x2 − x1 Trecând la limită avem: f ′( x2 ) − f ′( x1 ) lim = f ′′( x1 ) ≥ 0 x2 → x1 x2 − x1 şi afirmaţia este demonstrată. 8.2. Inegalităţi
o funcţie şi a, b ∈ , 8.2.1. Inegalitatea lui Jensen. Fie f : → a < b . Funcţia f este convexă pe [a, b] dacă şi numai dacă oricare ar fi punctele x1 , x2 ,K , xn ∈ [a, b] şi oricare ar fi numerele t1 , t2 ,K , tn ∈ [0,1] cu n
∑t i =1
i
= 1 are loc inegalitatea n n f ∑ ti xi ≤ ∑ ti f ( xi ) i =1 i =1
(1) Demonstraţie. Demonstrăm, mai întâi, că dacă x1 , x2 ,K , xn ∈ [a, b] cu
t1 , t2 ,K , tn ∈ [0,1] şi
n
∑ ti = 1 , atunci i =1
n
∑t x i =1
i i
= [ a, b ] .
Avem a ≤ x1 ≤ b,K , a ≤ xn ≤ b . Înmulţind inegalităţile respective cu numerele pozitive t1 , t2 ,K , tn şi adunându-le obţinem: a(t1 + t2 + K + tn ) ≤ t1 x1 + t2 x2 + K + tn xn ≤ b(t1 + t2 + K + tn ) . Cum
n
n
i =1
i =1
∑ ti = 1⇒ a ≤ ∑ ti xi ≤ b .
Demonstrăm necesitatea prin inducţie; Fie f convexă. Dacă n = 1 , inegalitatea (1) este evidentă. Presupunem inegalitatea adevărată pentru n şi demonstrăm că este adevărată şi pentru n + 1 .
246
Luăm x1 , x2 ,K , xn , xn +1 ∈ [a, b] şi numerele t1 , t2 ,K , tn , tn +1 ∈ [0,1] astfel n +1
încât
∑t i =1
i
= 1 . Vom demonstra că n +1 n +1 f ∑ ti xi ≤ ∑ ti f ( xi ) . i =1 i =1
(2) Conform ipotezei de inducţie avem: n +1 n −1 f ∑ ti xi = f ∑ ti xi + (tn xn + tn +1 xn +1 ) ≤ i =1 i =1 tn t ≤ t1 f ( x1 ) + K + tn −1 f ( xn −1 ) + (tn + tn +1 ) f ⋅ xn + n +1 ⋅ xn +1 , tn + tn +1 tn + tn +1 (3) tn t deoarece tn xn + tn +1 xn +1 = (tn + tn +1 ) xn + n +1 xn +1 . tn + tn +1 tn + tn +1 Datorită convexităţii lui f avem: tn t tn t f xn + n +1 xn +1 ≤ f ( xn ) + n +1 f ( xn +1 ) tn + tn +1 tn + tn +1 tn + tn +1 tn + tn +1 şi înlocuind în (3) obţinem inegalitatea (2). Suficienţa este evidentă. 8.2.2. Teoremă. (Inegalitatea lui Hölder). Dacă a1 , a2 ,K , an ≥ 0 , 1 1 b1 , b2 ,K , bn ≥ 0 , p > 1, q > 1 şi + = 1 , atunci: p q 1/ p
1/ q
n n ai bi ≤ ∑ aip ∑ biq . ∑ i =1 i =1 i =1 Demonstraţie. Considerăm funcţia f : (0, ∞) → 1 f ′′( x) = − 2 < 0 ⇒ f este strict concavă pe (0, ∞) . x n
n Fie a = ∑ aip i =1 n
enunţ se scrie
1/ p
n şi b = ∑ biq i =1
∑ a b ≤ ab . i =1
i i
1/ q
cu
, f ( x) = ln x . Avem:
1 1 + = 1 . Inegalitatea din p q
Cum f este concavă pe (0, ∞) , rezultă din
inegalitatea lui Jensen: p q 1 aip 1 biq 1 ai 1 bi ln ⋅ p + ⋅ q ≥ ln + ln , q b p a q b p a 247
sau 1 aip 1 biq ai bi ⋅ + ⋅ ≥ , p a p q b q ab
echivalent cu: 1 aip 1 biq ai bi ≤ ab ⋅ p + ⋅ q q b p a şi însumând după i de la 1 la n obţinem: n n p q a 1 ∑ i 1 ∑ bi n n 1 1 i =1 i =1 , sau ai bi ≤ ab + , a b ab ≤ ⋅ + ⋅ ∑ ∑ i i p q q b p a i =1 i =1 p q 1 1 dar + = 1 şi avem: p q 1/ p
1/ q
n p n q a b ≤ ∑ i i ∑ ai ∑ bi . i =1 i =1 i =1 Observaţie. Dacă p = q = 2 inegalitatea lui Hölder se reduce la inegalitatea Cauchy−Buniakovski−Schwartz. Dacă a1 , a2 ,K , an ≥ 0 , b1 , b2 ,K , bn ≥ 0 , atunci n
2
8.2.3. n
ai
∑n≥ i =1
n
n n 2 n 2 a b ∑ i i ≤ ∑ ai ∑ bi . i =1 i =1 i =1 Inegalitatea mediilor. Dacă a1 , a2 ,K , an ∈
* +
,
atunci
a1a2 L an .
Demonstraţie. Considerăm funcţia f : (0, ∞) → , f ( x) = ln x . Avem 1 f ′′( x) = − 2 < 0 , deci f este strict concavă pe (0, ∞) . Din inegalitatea lui x Jensen avem: n n f ∑ λi ai ≥ ∑ λi f (ai ) , i =1 i =1 n a 1 n 1 şi luând λ1 = λ2 = K = λn = avem: ln ∑ i ≥ ∑ ln ai , deci n n i =1 i =1 n n ai n ≥ a1a2 L an . ∑ i =1 n
248
Bibliografie 1. Bătineţu D.M., Maftei I.V., Stancu Minasian I.M., Exerciţii şi probleme de analiză matematică pentru clasele a XI-a şi a XII-a, Editura Didactică şi Pedagogică, Bucureşti, 1981 2. Buşneag D., Maftei I., Teme pentru cercurile şi concursurile de matematică ale elevilor, Editura Scrisul Românesc, Craiova, 1983 3. Ganga M., Elemente de analiză matematică, Editura Mathpress, 1997 4. Găină S., Metoda funcţiilor convexe, Gazeta Matematică nr.6, 1980 5. Leonte A., Niculescu C., Culegere de probleme de algebră şi analiză matematică, Editura Scrisul Românesc, Craiova, 1981 6. Nicolescu M., Analiză matematică, vol. II, Editura Tehnică, Bucureşti, 1958
249
Probleme rezolvate R8.3.1. Fie I ⊂
un interval, n ∈
*
şi fi : I → (0, ∞) , i = 1, n , n funcţii
pozitive şi concave iar α i > 0 , i = 1, n cu α1 + α 2 + K + α n = 1 . Atunci rezultă că
funcţia f = f1α1 ⋅ f 2α 2 ⋅L ⋅ f nα n este concavă. Soluţie. Fie x, y ∈ I arbitrar şi α , β ≥ 0 , α + β = 1 . Cum fi este
concavă, rezultă că fi (α x + β y ) ≥ α ⋅ fi ( x) + β ⋅ fi ( y ) , i = 1, n . Obţinem: n
n
∏ ( fi (α x + β y ) ) i ≥ ∏ (α fi ( x) + β ⋅ fi ( y ) ) i . α
i =1
α
i =1
(1) Trebuie demonstrat că f (α x + β y ) ≥ α ⋅ f ( x) + β ⋅ f ( y ) ⇔ n
n
n
i =1
i =1
∏ ( fi (α x + β y ) ) i ≥ α ⋅ ∏ f iαi ( x) + β ⋅ ∏ f iαi ( y ) α
i =1
(2) Demonstrăm că n
n
n
i =1
i =1
∏ (α fi ( x) + β fi ( y ) ) i ≥ α ⋅ ∏ f iαi ( x) + β ⋅ ∏ fiαi ( y ) . α
i =1
(3) Notăm fi ( x) = ai , fi ( y ) = bi . Relaţia (3) este echivalentă cu n
n
n
i =1
i =1
∏ (α ai + β bi ) i ≥ α ⋅ ∏ aiαi + β ⋅ ∏ biαi ⇔ α
i =1
⇔α ⋅
a1 ⋅ a2 ⋅K ⋅ an b1α1 ⋅ b2α 2 ⋅K ⋅ bnα n + ⋅ ≤1 β (α a1 + β b1 )α1 ⋅K ⋅ (α an + β bn )α n (α a1 + β b1 )α1 ⋅K ⋅ (α an + β bn )α n α1
α2
αn
(4) Folosind inegalitatea x1R1 ⋅ x2R2 ⋅K ⋅ xnRn ≤ R1 x1 + R2 x2 + K + Rn xn pentru xi > 0 , Ri > 0 , i = 1, n ,
n
∑R i =1
i
= 1 şi notând cu A membrul stâng al relaţiei (4), obţinem:
a1α1 b1α1 anα n bnα n A ≤ α ⋅ +K + +K + + β ⋅ ⇔ α an + β bn α an + β bn α a1 + β b1 α a1 + β b1 α a + β bn α a + β b1 ⇔ A ≤ α1 ⋅ 1 + K + αn ⋅ n ⇔ A ≤ α1 + α 2 + Kα n = 1 . α a1 + β b1 α an + β bn Aşadar, inegalitatea (4) este adevărată, deci inegalitatea dată de relaţia (3) este adevărată. Din (1) şi (3) rezultă că relaţia (2) este adevărată, deci f este concavă.
250
Consecinţă. Dacă fi : I → (0, ∞) , I ⊂ n ≥ 2 ). Atunci funcţia
n
sunt funcţii concave ( n ∈
f1 f 2 ⋅K ⋅ f n este concavă.
R8.3.2. Fie x1 , x2 ,K , xn > 0 şi λ1 , λ2 ,K , λn ∈ [0,1] cu n
∑λ x i =1
i i
,
n
∑λ i =1
i
= 1 . Atunci
n
≥ ∏ xiλi . i =1
1 < 0, x2 (∀) x > 0 , deci f este strict concavă pe (0, ∞) . Conform inegalităţii lui Jensen Soluţie. Fie
f : (0, ∞) →
f ( x) = ln x . Avem
,
f ′′( x) = −
n n n n avem: f ∑ λi xi ≥ ∑ λi f ( xi ) , echivalent cu ln ∑ λi xi ≥ ln ∏ xiλi ceea ce = 1 i i =1 i =1 i =1 este echivalent cu
n
n
i =1
i =1
∑ λi xi ≥ ∏ xiλ . i
Observaţie. Dacă în egalitatea precedentă facem λ1 = λ2 = K = λn = obţinem
1 n ∑ xi ≥ n x1 x2 L xn , adică inegalitatea mediilor. n i =1
R8.3.3. Dacă a1 , a2 ,K , an ∈
* +
n
, astfel încât
∑a i =1
i
= 1 şi p ∈
*
, atunci
p
1 (n 2 + 1) p . a + ≥ i ∑ ai n p −1 i =1 n
1 n
p
Soluţie. Considerăm funcţia f :
* +
p −2
→
* + 2
1 , f ( x) = x + . Avem x p −1
1 1 2p 1 f ′′( x) = p( p − 1) x + ⋅ 1 − 2 + 3 x + > 0 , x x x x (∀) x ∈ (0, ∞) , deci f este strict convexă pe (0, ∞) . Din inegalitatea lui Jensen avem: a + a + K + an 1 f 1 2 ≤ [ f (a1 ) + f (a2 ) + K + f (an )] n n n 1 n şi ţinând cont că ∑ ai = 1 ⇒ nf ≤ ∑ f (ai ) . Avem n i =1 i =1
251
p
1 (n 2 + 1) p 1 f = n+ = şi n np n adică avem:
n
∑ i =1
p
1 f (ai ) = ∑ ai + , ai i =1 n
p
n (n 2 + 1) p 1 ≤ ai + . ∑ p −1 n ai i =1
R8.3.4. Dacă x1 , x2 ,K , xn ∈ (0,1) şi
n
∑ xi = 1 , atunci i =1
Soluţie. Fie funcţia f : (0,1) → Deoarece f ′′( x) =
, f ( x) =
* +
1 n2 ≥ . ∑ n −1 i =1 1 − xi n
1 . 1− x
2 > 0 , (∀) x ∈ (0,1) , rezultă că f este strict convexă pe (1 − x)3
(0,1). 1 avem conform inegalităţii lui Jensen n n n2 1 n n f ∑ λi xi ≤ ∑ λi f ( xi ) , deci ≤∑ . Cum f este strict convexă, n − 1 i −1 1 − xi i =1 i =1 1 relaţia din enunţ devine egalitate dacă şi numai dacă x1 = x2 = K = xn = . n Luând λ1 = λ2 = K = λn =
R8.3.5. Dacă a, b, x1 , x2 ,K , xn ∈
* +
n
şi
∑x
i
i =1
= 1 , atunci
n b ∏ a + ≥ (a + nb) n . i =1 xi
Soluţie. Considerăm funcţia f : f ′′( x) =
2abx + b 2 > 0, (∀) x ∈ (ax 2 + bx) 2
* +
* +
→
b , f ( x) = ln a + . Deoarece x
, rezultă că f este strict convexă pe (0, ∞) .
1 avem: n n 1 n b b ln(a + nb) ≤ ∑ ln a + ⇔ (a + nb) n ≤ ∏ a + . i =1 n i =1 xi xi 1 Egalitatea se realizează dacă şi numai dacă x1 = x2 = K = xn = . n Luând λ1 = λ2 = K = λn =
252
n
R8.3.6. Dacă A1 A2 K An este poligon convex, atunci
α ∈ (0,1) .
∑ sinα A k =1
k
≤ n sinα
2π n
π π Soluţie. Fie f : 0, → , f ( x) = sinα x , f este concavă pe 0, . 2 2 Rezultă din inegalitatea lui Jensen că: 1 n π 2π 1 n 1 n sinα ∑ Ak ≥ ∑ sinα Ak , dar ∑ Ak = (n − 2) = π − n k =1 n n n k =1 n k =1 2π 2π şi cum sin π − , avem = sin n n n 2π 1 n α 2π , sinα Ak ≤ n sinα ∑ Ak = n sinα π − ∑ = n sin n n k =1 n k =1 deci inegalitatea din enunţ. R8.3.7. Fie funcţia f :[a, b] → continuă pe [a, b] şi de două ori derivabilă pe (a, b) şi astfel încât f ′′( x) > 0 , (∀) x ∈ (a, b) . Să se arate că (∀) α ∈ (a, b) tangenta la graficul lui f în punctul (α , f (α )) este sub graficul lui f. Soluţie. Cum f ′′ > 0 pe (a, b) ⇒ f ′ este crescătoare pe (a, b) . Ecuaţia tangentei la grafic în punctul (α , f (α )) este y − f (α ) = f ′(α )( x − α ) , adică y = f (α ) + f ′(α )( x − α ) . Aplicând teorema lui Lagrange funcţiei f pe intervalul (α , x) , x > α , obţinem f ( x) = f (α ) + f ′(c)( x − α ) cu α < c < x , şi cum f ′(c) > f ′(α ) ⇒ f ( x) > y . Pentru cazul x < α se raţionează analog.
253
9. Polinoamele Taylor asociate unor funcţii 9.1. Formula lui Taylor şi polinoamele Taylor ale funcţiilor elementare În jurul unui punct o funcţie derivabilă poate fi aproximată printr-o funcţie de gradul întâi. Ne punem în continuare problema aproximării unei funcţii printr-un polinom de grad superior. o submulţime a lui , x0 ∈ D şi f : D → o 9.1.1. Fie D ⊂
funcţie derivabilă de n ori (n ∈ * ) în punctul x0. Funcţia polinomială Tn f : → definită pentru orice x ∈ prin f ′( x0 ) f ′′( x0 ) f ( n ) ( x0 ) ( x − x0 ) + ( x − x0 ) 2 + K + ( x − x0 ) n , 1! 2! n! se numeşte polinomul lui Taylor de grad n ataşat funcţiei f şi punctului x0, iar funcţia rn f : D → definită prin (rn f )( x) = f ( x) − (Tn f )( x) , (∀) x ∈ D , se numeşte restul Taylor de ordinul n ataşat funcţiei f şi punctului x0. Orice egalitate de forma f = Tn f + rn f , unde pentru rn f este dată o formulă de calcul, se numeşte formulă Taylor de ordinul n corespunzător funcţiei f şi punctului x0. 9.1.2. Exemplu. Pentru funcţia f : → , f ( x) = e x , (∀) x ∈ , polinomul lui Taylor de grad n ataşat funcţiei f şi punctului x0 = 0 este (Tn f )( x) = f ( x0 ) +
x x2 xn + + K + , (∀) x ∈ . n! 1! 2! 9.1.3. Exemplu. Pentru funcţia g : → , g ( x) = sin x , (∀) x ∈ , polinomul lui Taylor de gradul 2n − 1 ataşat funcţiei g şi punctului x0 = 0 este (Tn f )( x) = 1 +
x x3 x5 x 2 n −1 − + − K + (−1) n −1 ⋅ , (∀) x ∈ . 1! 3! 5! (2n − 1)! 9.1.4. Exemplu. Pentru funcţia h : → , h( x) = cos x , (∀) x ∈ , polinomul lui Taylor de ordinul 2n − 2 (n ∈ , n ≥ 1) ataşat funcţiei h şi punctului x0 = 0 este (Tn g )( x) =
x2 x4 x6 x 2n−2 + − + K + (−1) n −1 ⋅ . 2! 4! 6! (2n − 2)! 9.1.5. Exemplu. Pentru funcţia u : (−1, ∞) → definită prin u ( x) = ln( x + 1) , (∀) x ∈ (−1, ∞) , avem (Tn h)( x) = 1 −
254
u ( k ) ( x) = (−1) k −1 ⋅
(k − 1)! , (∀) x ∈ (−1, ∞) şi k ∈ ( x + 1) k
*
, polinomul lui Taylor de
grad n este x x 2 x3 x 4 xn − + − + K + (−1) n −1 ⋅ , (∀) x ∈ (−1, ∞ ) . n 1 2 3 4 9.1.6. Exemplu. Pentru funcţia f : (−1, ∞) → , f ( x) = (1 + x)α , pentru orice x ∈ (−1, ∞) şi α ∈ \ , polinomul lui Taylor de grad n este α α (α − 1) 2 α (α − 1)L (α − n + 1) n (Tn f )( x) = 1 + ⋅ x + ⋅ x +K + ⋅x , 1! 2! n! deoarece avem f ( k ) ( x) = α (α − 1)(α − 2)L (α − k + 1)(1 + x)α − k , (∀) x > −1 şi (∀) k ∈ * . (Tn u )( x) =
α α (α − 1)(α − 2)L (α − k + 1) α Convenim să notăm = şi = 1 . Cu k! k 0 această notaţie avem α α α α (Tn f )( x) = + ⋅ x + ⋅ x 2 + K + ⋅ x n . 0 1 2 n Funcţia f : (−1, ∞) → exponent α.
, f ( x) = (1 + x)α se numeşte funcţie binomială de
e x + e− x 9.1.7. Exemplu. Pentru funcţia f : → , f ( x) = ch x = , 2 (∀) x ∈ (cosinus hiperbolic), polinomul lui Taylor de grad 2n este: (Tn f )( x) = 1 +
x2 x4 x2n . + +K + 2! 4! (2n)!
e x − e− x 9.1.8. Exemplu. Pentru funcţia f : → , f ( x) = sh x = , 2 (∀) x ∈ (sinus hiperbolic), polinomul lui Taylor de grad 2n − 1 (n ∈ * ) , este x x3 x5 x 2 n −1 + + +K + . 1! 3! 5! (2n − 1)! Facem observaţia că polinoamele de la ultimele două exemple pot fi obţinute utilizând Exemplul 9.1.2. 9.1.9. Definiţie. Fie A o mulţime nevidă din şi funcţiile f n : A → , (∀) n ∈ . Spunem că şirul ( f n ) n ≥0 este punctul convergent şi se (Tn f )( x) =
P.C.
notează f n → f dacă pentru orice x0 ∈ A , lim f n ( x0 ) = f ( x0 ) . Şirul ( f n ) n ≥0 se n →∞
255
U.C.
zice că este uniform convergent pe A către funcţia f şi se notează f n → f , dacă pentru (∀) ε > 0 ∃ N (ε ) natural astfel încât (∀) n ≥ N (ε ) să avem f n ( x) − f ( x) < ε , pentru orice x ∈ A . 9.1.10. Observaţie. Fie A o mulţime nevidă, ( f n ) n ≥0 un şir de funcţii definite pe A şi cu valori în iar sn = f 0 + f1 + f 2 + K + f n , (∀) n ∈ . Dacă şirul de funcţii ( sn ) n≥0 este uniform convergent pe A către funcţia s ∞
( lim sn ( x) = s ( x), (∀) x ∈ A ) , convenim să facem notaţia s ( x) = ∑ f n ( x) , n →∞
n =0
(∀) x ∈ A . Aceasta se numeşte dezvoltarea în serie a funcţiei s. Se poate demonstra că: ∞ (−1) n −1 ⋅ x 2 n −1 a) sin x = ∑ , (∀) x ∈ . (2n − 1)! n =1 (−1) n −1 ⋅ x 2 n − 2 , (∀) x ∈ (2n − 2)! n =1 ∞
b) cos x = ∑ ∞
xn c) e = ∑ , (∀) x ∈ n =0 n ! x
.
.
(−1) n −1 ⋅ x n , (∀) x ∈ (−1,1] . n n =1 ∞ α e) (1 + x)α = ∑ ⋅ x n , (∀) x ∈ (−1,1) , (α ∈ n=0 n ∞
d) ln(1 + x) = ∑
∞
x2n , (∀) x ∈ n = 0 (2n)!
f) ch x = ∑
\ ).
.
x 2 n −1 , (∀) x ∈ . n =1 (2n − 1)! 9.1.11. Observaţie. Polinomul lui Taylor de grad n ataşat funcţiei f şi punctului x0 , coincide în x0 atât cu funcţia f cât şi cu derivatele ei până la ordinul n. Demonstraţie. Evident, Tn f este o funcţie indefinit derivabilă pe şi pentru orice x ∈ avem x − x0 ( x − x0 ) n −1 ( n ) (Tn f )′( x) = f ′( x0 ) + f ′′( x0 ) + K + ⋅ f ( x0 ) ; 1! (n − 1)! ∞
g) sh x = ∑
256
x − x0 ( x − x0 ) n − 2 ( n ) f ′′′( x0 ) + K + ⋅ f ( x0 ) ; 1! (n − 2)! KKKKKKKKKKKKKKKKKKKKKK x − x0 ( n ) f ( x0 ) ; (Tn f )( n −1) ( x) = f ( n −1) ( x0 ) + 1! (Tn f )( n ) ( x) = f ( n ) ( x0 ) ; (Tn f )′′( x) = f ′′( x0 ) +
(Tn f )( k ) ( x) = 0 oricare ar fi k ∈ , k ≥ n + 1 . De aici deducem că (Tn f )( x) = f ( x0 ) , (Tn f )′( x0 ) = f ′( x0 ),K , (Tn f )( n ) ( x0 ) = f ( n ) ( x0 ) . Cu aceasta demonstraţia este încheiată. 9.1.12. Teoremă. Fie D ⊂ un interval, x0 ∈ D şi f : D → funcţie derivabilă de n ori (n ∈
*
o
) în punctul x0. Atunci avem (r f )( x) lim n = 0. x → x0 ( x − x ) n 0 Demonstraţie. Deoarece f şi Tn f sunt derivabile de n ori în x0 rezultă că şi restul rn f = f − Tn f este o funcţie derivabilă de n ori în x0 şi (rn f )( x0 ) = 0, (rn f )′( x0 ) = 0,K , (rn f )( n ) ( x0 ) = 0 . Aplicând de n − 1 ori regula lui L’Hôpital şi ţinând seama că f ( n −1) ( x) − f ( n −1) ( x0 ) lim = f ( n ) ( x0 ) , x → x0 x − x0 obţinem (r f )( x) f ( x) − (Tn f )( x) f ′( x) − (Tn f )′( x) lim n = lim = lim =K = n x → x0 ( x − x ) n x → x0 x x → 0 ( x − x0 ) n( x − x0 ) n −1 0 = lim
x → x0
f ( n −1) ( x) − (Tn f )( n −1) ( x) f ( n −1) ( x) − f ( n −1) ( x0 ) − f ( n ) ( x0 )( x − x0 ) = lim = x → x0 n !( x − x0 ) n ! ( x − x0 ) f ( n −1) ( x) − f ( n −1) ( x0 ) 1 − f ( n ) ( x0 ) = 0 . lim n ! x → x0 x − x0 9.1.13. Observaţie. Dacă notăm cu α n f : D →
=
(rn f )( x) , x ∈ D \{x0 } (α n f )( x) = ( x − x0 ) n 0 , x = 0,
funcţia dată prin
atunci din Teorema 9.1.12 rezultă că funcţia α n f este continuă în x0. 257
Aşadar are loc teorema 9.1.14. Teoremă. (Teorema lui Taylor-Young). Fie D ⊂ un interval, x0 ∈ D şi f : D → o funcţie. Dacă funcţia f este derivabilă de n ori în punctul x0 , atunci există o funcţie α n f : D → care satisface următoarele proprietăţi: a) (α n f )( x0 ) = 0 . b) Funcţia α n f este continuă în punctul x0 . c) Pentru orice x ∈ D are loc egalitatea f ′( x0 ) f ( n ) ( x0 ) ( x − x0 ) + K + ( x − x0 ) n + ( x − x0 ) n ⋅ (α n f )( x) . f ( x) = f ( x0 ) + 1! n! Vom deduce, în continuare, o formulă pentru calculul restului rn f al formulei Taylor. Fie D ⊂ interval, f : D → o funcţie derivabilă de (n + 1) ori pe D, p ∈ * şi x şi x0 două puncte distincte din D. Fie k ∈ astfel încât să avem f ′( x0 ) f ′′( x0 ) f ( n ) ( x0 ) ( x − x0 ) + ( x − x0 ) 2 + K + ( x − x0 ) n + ( x − x0 ) p k f ( x) = f ( x0 ) + 1! 2! n! Funcţia ϕ : D → , definită pentru orice t ∈ D prin f ′(t ) f ( n ) (t ) (x − t) +K + ( x − t )n + ( x − t ) p ⋅ k , ϕ (t ) = f (t ) + 1! n! este derivabilă pe D ca şi sumă de funcţii derivabile. Deoarece ϕ ( x0 ) = f ( x) = ϕ ( x) , aplicând teorema lui Rolle funcţiei ϕ pe intervalul [ x0 , x] sau [ x, x0 ] , rezultă că există un punct c cuprins strict între x0 şi x astfel încât ϕ ′(c) = 0 . Dar f ′′(t ) (x − t) ( x − t )2 (x − t) − f ′′(t ) + f ′′′(t ) − K − ϕ ′(t ) = f ′(t ) − f ′(t ) + 1! 1! 2! ( x − t ) n −1 ( n ) ( x − t ) n ( n +1) (t ) − p ⋅ ( x − t ) p −1 ⋅ k = − f (t ) + f (n − 1)! n! ( x − t ) n ( n +1) (t ) − p( x − t ) p −1 ⋅ k , (∀) t ∈ D . f n! ( x − c) n ( n +1) (t ) = p( x − c) p −1 ⋅ k , de f Atunci egalitatea ϕ ′(c) = 0 devine n! unde obţinem: ( x − c) n − p +1 ( n +1) k= ⋅f (c ) . n !⋅ p =
258
De aici se obţine că restul rn f are forma ( x − x0 ) p ⋅ ( x − c) n − p +1 ( n +1) ⋅f (c ) . n !⋅ p În consecinţă, se obţine teorema 9.1.15. Teoremă. (Teorema lui Taylor). Fie D ⊂ un interval, f : D → o funcţie de (n + 1) ori derivabilă pe D şi x0 ∈ D . Atunci pentru (rn f )( x) =
orice p ∈ * şi x ∈ D \{x0 } , există cel puţin un punct c cuprins strict între x şi x0 astfel încât ( x − x0 ) p ⋅ ( x − c) n − p +1 ( n +1) (rn f )( x) = ⋅f (c ) . n !⋅ p (1) Restul scris sub forma (1) se numeşte restul lui Schlömilch – Roche. Luând p = 1 obţinem restul lui Cauchy: ( x − x0 )( x − c) n ( n +1) (rn f )( x) = ⋅f (c ) . n! (2)
Luând p = n + 1 , obţinem restul lui Lagrange: (rn f )( x) =
( x − x0 ) n +1 ( n +1) ⋅f (c ) . (n + 1)!
(3) 9.1.16. Observaţie. Deoarece c ∈ ( x0 , x) sau c ∈ ( x, x0 ) , notând c − x0 obţinem că θ ∈ (0,1) şi c = x0 + θ ( x − x0 ) . Atunci restul rn f se θ= x − x0 poate exprima şi în felul următor: ( x − x0 ) n +1 ⋅ (1 − θ ) n − p +1 ( n +1) (rn f )( x) = ⋅f ( x0 + θ ( x − x0 )) ; n! ⋅ p (Schlömilch – Roche) n +1 n ( x − x0 ) ⋅ (1 − θ ) (rn f )( x) = ⋅ f ( n +1) ( x0 + θ ( x − x0 )) ; n! (Cauchy) n +1 ( x − x0 ) (rn f )( x) = ⋅ f ( n +1) ( x0 + θ ( x − x0 )) . (n + 1)! (Lagrange)
259
9.1.17. Definiţie. Formula lui Taylor de ordin n corespunzătoare funcţiei f şi punctului x0 = 0 , cu restul lui Lagrange, se numeşte formula lui Mac Laurin: f ′(0) f ′′(0) 2 f ( n ) (0) n f ( n +1) (θ x) n +1 f ( x) = f (0) + x+ x +K + ⋅x + ⋅x , 1! 2! (n + 1)! n! unde θ ∈ (0,1) . 9.1.18. Exemplu. Pentru funcţiile f, g, h şi u din exemplele 9.1.2−9.1.4, formula lui Mac Laurin se scrie: x x2 xn x n +1 θ x e , x ∈ , θ ∈ (0,1) ; 1) f ( x) = e x = 1 + + + K + + n ! (n + 1)! 1! 2! x x3 x5 x 2 n −1 x 2 n +1 − + − K + (−1) n −1 + (−1) n cos θ x 1! 3! 5! (2n − 1)! (2n + 1)! şi θ ∈ (0,1) ;
2) g ( x) = sin x = , x∈
2n x2 x4 x6 x 2n−2 n −1 n x + (−1) cos θ x, 3) h( x) = cos x = 1 − + − + K + (−1) 2! 4! 6! (2n − 2)! (2n)! x ∈ şi θ ∈ (0,1) ;
x x 2 x3 x 4 xn x n +1 1 , − + − + K + (−1) n −1 + (−1) n ⋅ 1 2 3 4 n n + 1 (1 + θ x) n +1 x > −1 şi θ ∈ (0,1) .
4) u ( x) = ln(1 + x) =
9.1.19. Exemplu. Pentru funcţia f : (−1, ∞) → , f ( x) = (1 + x)α , (∀) x > −1 şi α ∈ , formula lui Mac Laurin este: α α (α − 1) 2 α (α − 1)(α − 2)L (α − n + 1) n f ( x) = (1 + x)α = 1 + x + x +K+ x + 1! 2! n! α (α − 1)L (α − n)(1 + θ x)α − n n +1 + ⋅ x , unde θ ∈ (0,1) . (n + 1)! Demonstraţie. Funcţia f este indefinit derivabilă pe (−1, ∞) şi avem f ′( x) = α (1 + x)α −1 ; f ′′( x) = α (α − 1)(1 + x)α − 2 ; f ′′′( x) = α (α − 1)(α − 2)(1 + x)α −3 şi prin inducţie matematică se obţine f ( k ) ( x) = α (α − 1)(α − 2)L (α − k + 1)(1 + x)α − k , k ∈ * . În consecinţă, obţinem α α (α − 1) 2 α (α − 1)(α − 2)L (α − n + 1) n f ( x) = (1 + x)α = 1 + x + x +K+ x + 1! 2! n! α (α − 1)L (α − n)(1 + θ x)α − n n +1 + ⋅x . (n + 1)!
260
9.1.20. Propoziţie. Avem inegalităţile: x x2 xn a) e x > 1 + + + K + , (∀) x > 0 şi n ∈ * ; n! 1! 2! 2 2 n −1 x x x x x2 x2n < ex < 1 + + + K + , (∀) x < 0 şi b) 1 + + + K + 1! 2! (2n − 1)! 1! 2! (2n)! n∈ * ; x3 x5 (−1) n ⋅ x 2 n +1 c) x − + − K + < sin x < 3! 5! (2n + 1)! x3 x5 (−1) n x 2 n +1 (−1) n +1 x 2 n +3 + −K + + , 3! 5! (2n + 1)! (2n + 3)! (∀) n ∈ * impar. < x−
d) 1 −
(∀) x > 0
şi
x2 x4 (−1) n ⋅ x 2 n + −K + < cos x < 2! 4! (2n)!
x2 x4 (−1) n x 2 n (−1) n +1 x 2 n + 2 + −K + + , 2! 4! (2n)! (2n + 2)! (∀) n ∈ * impar. < 1−
(∀) x ∈
*
şi
x 2 x3 (−1) n +1 ⋅ x n x 2 x3 + −K + < ln(1 + x) < x − + − K + 2 3 n 2 3 n +1 n n+2 n +1 (−1) ⋅ x (−1) ⋅ x + + , (∀) x > 0 şi (∀) n ∈ * par. n n +1 Demonstraţie. Inegalităţile date se arată utilizând formula lui Taylor cu restul Lagrange pentru funcţiile sugerate de fiecare inegalitate. Să justificăm, spre exemplu b). Avem x x2 xn x n +1 ex = 1 + + + K + + ⋅ eθ x , (∀) x ∈ , n ∈ * şi θ ∈ (0,1) . n ! (n + 1)! 1! 2! Atunci x x2 x 2 n −1 x x2n 1+ + +K + < ex < 1 + + K + ⇔ 1! 2! (2n − 1)! 1! (2n)! e) x −
x 2n θ ⋅x e > 0 (adev ã rat) x 2 n θ ⋅x x2n (2n)! e < ⇔0< ⇔ 2n ⇔ eθ ⋅ x < 1 ⇔ 2n (2n)! (2n)! x x eθ ⋅ x < (2n)! (2n)! ⇔ θ ⋅ x < 0 , relaţie adevărată. Aşadar, inegalitatea de la b) este adevărată.
261
9.1.21. Consecinţă. Avem inegalităţile: x3 x3 x5 a) x − < sin x < x − + , (∀) x > 0 ; 3! 3! 5! 2 x x 2 x3 b) x − < ln(1 + x) < x − + , (∀) x > 0 . 2 2 3 Demonstraţie. Sunt cazuri particulare ale inegalităţilor de la Propoziţia
9.1.20.
Bibliografie 1. 2. 3. 4. 5. 6.
Dorin Andreica, Dorel I.Duca, Ioana Pop, Ioan Purdea, Matematica de bază, Editura Studium, Cluj-Napoca, 2000 Marius Burtea, Georgeta Burtea, Elemente de analiză matematică, Editura Carminis, Piteşti Paul Flondor, Octavian Stănăşilă, Lecţii de analiză matematică, Editura All, Bucureşti, 1993 Kolumbán Iosif, Angela Vasiu, Paula Ciceo, Mărcuş Andrei, Culegere de probleme de analiză matematică, geometrie şi algebră, Universitatea din Cluj-Napoca, 1988 Adrian Muscalu, Articolul: Dezvoltarea în serie Taylor şi aplicaţii, G.M. 4/2001 Gheorghe Sireţchi, Calcul diferenţial şi integral, vol.2, Editura Ştiinţifică şi Enciclopedică, Bucureşti, 1985
262
Probleme rezolvate 1 1 1 (−1) n −1 , n ∈ * este R9.2.1. Să se arate că şirul an = 1 − + − + K + 2 3 4 n convergent şi să se afle limita sa. Soluţie. Pentru funcţia u : (−1, ∞) → , u ( x) = ln(1 + x) , (∀) x > −1 , utilizăm formula lui Mac Laurin şi obţinem x 2 x3 xn (−1) n ⋅ x n +1 , x > −1 u ( x) = ln(1 + x) = x − + − K + (−1) n −1 + 2 3 n (n + 1)(1 + θ x) n +1 θ ∈ (0,1) . Pentru x =1 obţinem: şi 1 1 1 (−1) n ln 2 = 1 − + − K + (−1) n −1 ⋅ + . De aici obţinem 2 3 n (n + 1)(1 + θ ) n +1
(−1) n lim an = lim ln 2 − = ln 2 . n + 1 n →∞ n →∞ (n + 1)(1 + θ ) cu proprietatea că R9.2.2. Fie f : → o funcţie de trei ori derivabilă pe lim f ( x) = c , c ∈ şi lim f ′′′( x) = 0 . Să se arate că lim f ′( x) = 0 şi x →∞
x →∞
x →∞
lim f ′′( x) = 0 . x →∞
Soluţie. Cu formula lui Taylor obţinem: f ′′( x) f ′′′(a ) f ( x + 1) = f ( x) + f ′( x) + + , unde a ∈ ( x, x + 1) 2! 3! (1) şi f ( x + 2) = f ( x) + 2 ⋅ f ′( x) + 22 ⋅
f ′′( x) 3 f ′′′(b) +2 ⋅ unde b ∈ ( x, x + 2) 2! 3!
(2)
Deoarece pentru x → ∞ avem a → ∞ şi b → ∞ , din relaţiile (1) şi (2) obţinem: f ′′( x) 1 ip. lim f ′( x) + = lim f ( x + 1) − f ( x) − f ′′′(b) = c − c − 0 = 0 ; x →∞ 2 x →∞ 3! (1’) 8 ip. lim(2 f ′( x) + 2 f ′′( x)) = lim f ( x + 2) − f ( x) − f ′′′(b) = c − c − 0 = 0 ; x →∞ x →∞ 3! Utilizând ultimele două relaţii avem: 1 lim f ′′( x) = lim (2 f ′( x) + 2 f ′′( x)) − 2 f ′( x) + f ′′( x) = 0 − 2 ⋅ 0 = 0 x →∞ x →∞ 2 263
şi apoi din (1’) rezultă că lim f ′( x) = 0 . x →∞
şi cu derivata a R9.2.3. Fie f : → o funcţie de două ori derivabilă pe doua continuă astfel încât f ( x + y ) ⋅ f ( x − y ) ≤ f 2 ( x) , (∀) x, y ∈ . Arătaţi că f ( x) ⋅ f ′′( x) ≤ f ′2 ( x) , (∀) x ∈ . Soluţie. Aplicând formula lui Taylor obţinem: f ′( x) f ′′(c1 ) 2 f ( x + y ) = f ( x) + ⋅y+ ⋅ y , c1 ∈ ( x, x + y ) ; 1! 2! f ′( x) f ′′(c2 ) 2 f ( x − y ) = f ( x) − ⋅y+ ⋅ y , c2 ∈ ( x − y, y ) . 1! 2! Folosind relaţia din ipoteză obţinem: y2 y4 2 2 2 ′ ′ ′′ ′′ f ( x) − y f ( x) + ( f ( x) − yf ( x) )( f (c1 ) + f (c2 ) ) + f ′′(c1 ) f ′′(c2 ) ≤ f 2 ( x) 2 4 de unde prin reducerea termenilor şi împărţirea la y 2 avem: y2 f ′′(c1 ) ⋅ f ′′(c2 ) ≤ 0 . 2 Pentru y → 0 avem că c1 → x şi c2 → x , şi relaţia devine: − f ′2 ( x) + f ′′( x) ⋅ f ( x) ≤ 0 ⇒ f ( x) ⋅ f ′′( x) ≤ f ′2 ( x) . − f ′2 ( x) + ( f ( x) − yf ′( x) )( f ′′(c1 ) + f ′′(c2 ) ) +
R9.2.4. Să se calculeze e cu cinci zecimale exacte. Soluţie. Scriem formula lui Taylor cu restul lui Lagrange şi obţinem: x x2 x n −1 xn ex = 1 + + + K + + eθ x , θ ∈ (0,1) . 1! 2! (n − 1)! n ! De aici rezultă: 1 θ 1 1 1 1 2 e = e2 = 1+ + + K + + ⋅ e . 1!⋅ 2 2!⋅ 22 (n − 1)!⋅ 2n −1 n !⋅ 2n Determinăm pe n astfel încât θ 1 1 2 rn = ⋅ e < 6. n n !⋅ 2 10 Avem: 1 1 3 1 1 1 2 rn < ⋅ e < < şi < 6 pentru n ≥ 8 . n n n −1 n −1 n !⋅ 2 n !⋅ 2 n !⋅ 2 n !⋅ 2 10 Prin urmare,
264
1 1 1 1 + 0,5 + 0,125 + 0, 0208333 + + +K + 2 1!⋅ 2 2!⋅ 2 7!⋅ 27 +0, 0026041 + 0, 0002604 + 0, 0000271 + 0, 0000015 = 1, 6487345
e 1+ .
−
x2 2
cos x − e . x →0 x4 Soluţie. Avem : x2 x4 r ( x) cos x = 1 − + + r1 ( x) cu lim 1 4 = 0 şi x →0 x 2! 4!
R9.2.5. Calculaţi lim
e
−
x2 2
x2 x4 r ( x) = 1− + + r2 ( x) cu lim 2 4 = 0 . 0 x → 1!⋅ 2 2!⋅ 4 x
Atunci avem: 1 1 x4 − + r1 ( x) − r2 ( x) cos x − e 4! 2!⋅ 4 = lim = lim x →0 x →0 x4 x4 1 1 r1 ( x) r2 ( x) 1 1 1 = lim − + 4 − 4 = − =− . x →0 12 x 24 8 4! 2!⋅ 4 x −
R9.2.6.
x2 2
Să se arate că:
ex > 1 +
x x2 xn + + K + , ( ∀) x ∈ (0, ∞) ) n! 1! 2!
şi
(∀) n ∈ * . Soluţie. Scriind formula lui Taylor cu restul lui Lagrange, obţinem: x x2 xn x n +1 x ⋅ eθ x , θ ∈ (0,1) . e = 1+ + +K + + 1! 2! n ! (n + 1)! De aici, utilizând faptul că
x n +1 ⋅ eθ x > 0, (∀) x > 0 şi (∀) n ∈ (n + 1)!
*
, obţinem
concluzia. (n + 1) n , (∀) n ∈ * . R9.2.7. Demonstraţi inegalitatea e > n! Soluţie. Procedând ca şi la problema anterioară, avem: n n2 n n −1 nn + ⋅ eθ n , θ ∈ (0,1) . en = 1 + + + K + 1! 2! (n − 1)! n ! 1 1 1 ,K , sunt mai mici sau egale cu 1 şi eθ n > 1 , avem: Deoarece , n ! (n − 1)! 1! n
265
en > 1⋅
1 n 1 n n −1 1 n n 1 n(n − 1) 2 + ⋅ +K + ⋅ + = 1 + n ⋅ n + ⋅ n + K + nn = (n − 1)! 1! n ! n ! 2! n ! 1! (n − 1)!
1 (1 + n) n . n! R9.2.8. Să se arate că: lim n ⋅ sin(2π e ⋅ n !) = 2π . =
n →∞
Soluţie. Avem : 1 1 1 eθ , θ = θ n (depinde de n) ∈ (0,1) , + e = 1+ + +K + 1! 2! (n + 1)! (n + 2)! de unde: 1 1 1 eθ n ⋅ sin(2π e ⋅ n) = n ⋅ sin 2π 1 + + + K + + ⋅ n ! = + + 1! 2! ( n 1)! ( n 2)! 1 eθ = n ⋅ sin 2π + . + + + n 1 ( n 1)( n 2) Ca urmare, lim n ⋅ sin(2π e ⋅ n) = n →∞
1 eθ π sin 2 + 1 eθ n + 1 (n + 1)(n + 2) = lim n ⋅ ⋅ 2π + = n →∞ n + 1 (n + 1)(n + 2) 1 eθ 2π + n + 1 (n + 1)(n + 2) 1 eθ = lim 2π n + = 2π (1 + 0) = 2π . n →∞ n + 1 (n + 1)(n + 2) R9.2.9. Fie funcţia f :[0,1] → de două ori derivabilă astfel încât f (0) = f (1) = 0 şi inf f ( x) = −1 . Să se arate că sup f ′′( x) ≥ 8 . x∈[0,1]
x∈[0,1]
Soluţie. Din ipoteză avem f continuă pe [0,1] ⇒ −1 = inf f ( x) = min f ( x) şi cum f este derivabilă pe [0, 1] va rezulta x∈[0,1]
x∈[0,1]
că (∃) a ∈ (0,1) astfel încât f ′(a ) = 0 şi f (a) = −1 . Scriind formula lui Taylor, avem: 1 f ( x) = −1 + ⋅ f ′′(a + θ x ( x − a)) ⋅ ( x − a ) 2 , θ x ∈ (0,1) . 2!
266
Pentru x = 0 se obţine 0 = −1 + 0 = −1 +
f ′′(a + θ1 (1 − a)) (1 − a ) 2 . 2
f ′′(a + θ x (− a)) 2 ⋅ a iar pentru x = 1 avem 2
2 2 , c1 = , i ∈ {0,1} . 2 a (1 − a) 2 1 1 Dacă a < , atunci c0 ≥ 8 , iar dacă a ≥ , atunci c1 ≥ 8 , deci sup f ′′( x) ≥ 8 . 2 2 x∈[0,1] * R9.2.10. Fie P o funcţie polinomială de grad n, n ∈ şi având coeficienţi reali. Să se arate că dacă: P (a ) > 0, P′(a ) ≥ 0,K , P ( n ) (a ) ≥ 0 , atunci, orice rădăcină reală a lui P este mai mică decât a. Soluţie. Pentru orice x > a , avem P′(a ) P ( n ) (a) P ( x) = P(a) + ( x − a) + K + ( x − a)n > P(a) , 1! n! de unde rezultă concluzia problemei. Deci f ′′( a + θ i (i − a)) = ci , unde c0 =
267
10. Aplicaţii ale metodelor topologice în geometrie 10.1. Aspecte teoretice Unele probleme de geometrie, în special probleme de existenţă care nu pot fi rezolvate constructiv, au soluţii elegante dacă se folosesc cunoştinţe de analiză matematică (în special continuitatea unor funcţii). Cunoştinţele necesare unor astfel de abordări sunt foarte legate de intuiţia geometrică şi necesită foarte puţine extinderi faţă de cunoştinţele din programa de analiză matematică a clasei a XI-a. Cadrul general în care se dezvoltă analiza matematică este spaţiul topologic. 10.1.1. Definiţie. Dacă X este o mulţime şi D = {Di | i ∈ I } este o familie de submulţimi din X cu proprietăţile: a) ∅ ∈ D, X ∈ D b) Pentru orice J ⊂ I , U D j ∈ D j∈J
c) Pentru orice mulţime finită {i1 , i2 ,..., in } ⊂ I , Di1 ∩ Di2 ∩ ... ∩ Din ∈ D atunci D se numeşte topologie pe X, iar perechea ( X , D) se numeşte spaţiu topologic. 10.1.2. Exemple. 1. Pe R (axa reală) o mulţime D ⊂ R este deschisă dacă pentru orice x0 ∈ D există ε > 0 astfel ca intervalul deschis: ( x0 − ε, x0 + ε) să fie inclus în D. 2. În R2 (plan) o mulţime D ⊂ R 2 este deschisă dacă pentru orice punct ( x0 , y 0 ) ∈ D există ε > 0 astfel ca discul deschis D( x0 , y0 ),ε centrat în ( x0 , y 0 ) şi de rază ε să fie în întregime inclus în D. 3. În R3 (spaţiu) o mulţime D ⊂ R 3 este deschisă dacă pentru orice punct M ∈ D există ε > 0 astfel ca bila deschisă (fără frontieră), de centru M şi rază ε să fie complet inclusă în D. 10.1.3. Definiţie. Dacă ( X , D X ) şi (Y , DY ) sunt spaţii topologice şi f : X → Y este o funcţie, spunem că funcţia f este continuă dacă pentru orice DY ∈ DY prin imagine f −1 ( DY ) ∈ D X . (O funcţie este continuă dacă şi numai dacă întoarce mulţimi deschise în mulţimi deschise.) Vom enumera câteva rezultate care sunt necesare în astfel de probleme, justificând doar cele necunoscute din manuale. 268
10.1.4. Rezultate fundamentale 1. Dacă f : [a, b] → R este o funcţie continuă şi f (a) f (b) < 0 atunci există cel puţin un c ∈ (a, b) astfel ca f (c) = 0 . 2. Dacă f : [a, b] → [a, b] este o funcţie continuă, atunci există c ∈ [a, b] astfel ca f (c) = c (punct fix). (Se consideră funcţia g ( x) = f ( x) − x , g (a) g (b) ≤ 0 .) 3. Dacă f : (a, b) ∈ R este o funcţie continuă şi există L > 0 astfel ca | f ( x) − f ( y ) |≤ L | x − y | atunci funcţia f este continuă. (Dacă L < 1 ea este o contracţie, în general este o funcţie Lipschitziană. În particular izometriile sunt funcţii continue.) 4. Dacă A este o mulţime mărginită în plan, d : ax + by + c = 0 este o dreaptă fixă şi definim f : R → R , f (λ) = aria porţiunii cuprinsă între dreptele d şi d λ : ax + by + c = λ , atunci funcţia f este continuă. (Deoarece A este mărginită, există un disc D de rază R în care este inclusă A.)
D A
dx dy
Distanţa între dreptele paralele d λ şi d µ este ρ λ ,µ = | f (λ) − f (µ) |≤
|λ −µ|
⋅ 2 R = L | λ − µ | , unde L =
|λ −µ| a2 + b2
. Atunci
2R
, deci f este o a2 + b2 a +b funcţie Lipschitziană (continuă). 5. Dacă A este o mulţime mărginită în plan, ( x0 , y 0 ) este un punct fix prin care trece dreapta d atunci funcţia f : R → R , f (m) = aria porţiunii din A cuprinsă între dreptele d şi d m : y − y0 = m( x − x0 ) este o funcţie continuă. 2
2
(Deoarece A este mărginită, există un disc D de rază R cu centrul în O( x0 , y0 ) care conţine mulţimea A. Notând cu α1, 2 unghiul dintre dreptele d m1 şi d m2 ,
269
obţinem | f (m1 ) − f (m2 ) |≤ 2 R 2 ⋅
α1, 2 π
, inegalitate ce asigură continuitatea
funcţiei f. dm2
dm1
dm1
D
dm2 A
A O
D
O
6. Transformările geometrice ca: rotaţia în jurul unui punct (în plan sau spaţiu), translaţia, omotetia, proiecţia în plan sau proiecţia pe o dreaptă (pe un plan), simetrie faţă de o dreaptă, un punct (sau un plan) sunt toate funcţii continue, ele fiind izometrii (rotaţiile, translaţiile, simetriile) iar celelalte funcţii Lipschitziene. 7. Distanţa la un punct, la un plan sau la o dreaptă sunt funcţii continue.
Bibliografie
[1] W. G. Chimm, M. E. Steenrod, Introducere în topologie, Ed. Tehnică, Bucureşti, 1981. [2] Dan Grecu, Probleme de geometrie rezolvate prin metode topologice, Revista Matematică Timişoara 1/1985, 3-10. [3] R. Couran, H. Roberts, Ce este matematica?, Ed. Ştiinţifică, Bucureşti, 1969, 334-337. [4] Gh. Buicitu, Probleme de construcţii geometrice cu rigla şi compasul, Ed. Tehnică, Bucureşti, 1957.
270
11. Ecuaţii transcendente Această temă constituie o continuare firească a temei 7: “Ecuaţii exponenţiale şi logaritmice nestandard”, din Ghidul profesorului de matematică, pentru clasa a X-a. Considerăm ecuaţia f ( x) = 0 , unde f : D → R, D ⊆ R este o funcţie dată. Dacă f este o funcţie polinomială nenulă, ataşată unui polinom din C [X ], ecuaţia se numeşte algebrică. O ecuaţie care nu poate fi redusă la o ecuaţie algebrică, folosind operaţiile: adunare, înmulţire, ridicare la putere, etc., se numeşte transcendentă. De exemplu x 3 − 5 x + 2 = 0 reprezintă o ecuaţie algebrică de gradul 3; arătăm că ecuaţia ln(1 + x) = 2 − 2 x, x > −1 este transcendentă. Presupunem contrariul: există un polinom nenul P ∈ R[X ] astfel încât pentru funcţia sa polinomială f, avem: f ( x) = ln(1 + x) + 2 x − 2 , pentru orice x > −1 . Evident P nu este un polinom constant. Fie grad P = n ∈ N * . Derivând de n+1 ori în ambii (−1) n ⋅ n! membri ai relaţiei de mai sus, obţinem: 0 = , pentru orice x > −1 . ( x + 1) n +1
Punând x = 0, obţinem: 0 = (− 1) ⋅ n! , care evident reprezintă o contradicţie. Nu ne propunem să verificăm că anumite ecuaţii sunt sau nu transcendente, scopul nostru este de a rezolva astfel de ecuaţii. Nu există metode generale de rezolvare. Fiecare ecuaţie propusă trebuie examinată aparte: i se caută caracteristicile şi pe baza lor se elaborează un mod de rezolvare. Vom indica câteva moduri de abordare a acestor ecuaţii. În mare parte, acestea au fost expuse în tema mai sus amintită, dar de data aceasta având la îndemână puternicul instrument oferit de aparatul analizei matematice. n
11.1. Utilizarea monotoniei unor funcţii
Amintim câteva rezultate cunoscute din teoria funcţiilor. 11.1.1. Propoziţie : Fie f , g : A → R, A ⊆ R . a) Dacă funcţiile f şi g sunt strict crescătoare (descrescătoare) pe A, atunci f +g este o funcţie strict crescătoare (descrescătoare) pe A. b) Dacă f , g : A → (0, ∞ ) sunt strict crescătoare (descrescătoare), atunci f ⋅ g este funcţie strict crescătoare (descrescătoare).
275
11.1.2. Propoziţie : Fie f : A → B , g : B → C . a) Dacă f şi g sunt funcţii strict monotone, de aceeaşi monotonie, atunci g o f este strict crescătoare . b) Dacă f, g sunt funcţii strict monotone, de monotonii diferite, atunci g o f este strict descrescătoare. 11.1.3. Propoziţie : Dacă I ⊆ R este interval şi f : I → R este o funcţie derivabilă pe I, atunci sunt adevărate următoarele afirmaţii: a) f este crescătoare dacă şi numai dacă f ' ( x ) ≥ 0 , ∀ x ∈ I . b) f este descrescătoare dacă şi numai dacă f ' ( x ) ≤ 0 , ∀ x ∈ I . 11.1.4. Propoziţie Dacă funcţia f este strict monotonă pe un interval I, iar c este o constantă reală, atunci ecuaţia f ( x) = c are pe intervalul I cel mult o soluţie. Demonstraţie : Fie f o funcţie strict crescătoare. Presupunem că ecuaţia f ( x) = c are cel puţin două soluţii diferite x1 , x 2 pe intervalul I. Fie x1 < x 2 . f ( x1 ) < f ( x 2 ) . Contradicţie cu Din f strict crescătoare rezultă f ( x1 ) = f ( x 2 ) = c . 11.1.5. Teoremă : Dacă funcţiile f şi g sunt monotone pe intervalul I, de monotonii diferite, cel puţin una dintre ele strict monotonă, atunci ecuaţia f ( x) = g ( x) are cel mult o soluţie în intervalul I. Demonstraţie : Fie f strict crescătoare, iar g descrescătoare pe intervalul I. Presupunem că există cel puţin două soluţii diferite x1 , x 2 din intervalul I, ale ecuaţiei f ( x) = g ( x) . Fie x1 < x 2 . Atunci f ( x1 ) = g ( x1 ) ≥ g ( x 2 ) = f ( x 2 ) . Contradicţie cu f funcţie strict crescătoare pe intervalul I. 11.1.6. Teoremă : Dacă funcţia f are proprietatea lui Darboux pe intervalul I (în particular dacă f este continuă pe I ) şi dacă a, b ∈ I astfel încât f (a) ⋅ f (b) < 0 , atunci ecuaţia f ( x) = 0 , are cel puţin o soluţie între a şi b. 11.2. Rezolvarea unor ecuaţii cu ajutorul teoremei lui Rolle şi a teoremei lui Lagrange 11.2.1. Teoremă (Rolle): Fie a , b ∈ R , cu a < b , iar f : [a , b ] → R o funcţie continuă pe [a,b], derivabilă pe (a,b) şi f (a) = f (b) . Atunci există cel puţin un punct c ∈ (a, b ) astfel încât f ' (c) = 0 .
276
11.2.2. Consecinţă : Între două rădăcini ale unei funcţii derivabile pe interval se află cel puţin o rădăcină a derivatei. 11.2.3. Teoremă (Lagrange): Fie a, b ∈ R, cu a < b , iar f : [a, b] → R o funcţie continuă pe [a,b] şi f (b) − f (a) derivabilă pe (a,b). Atunci există c ∈ (a, b ) astfel încât = f ' (c ) . b−a 11.3. Utilizarea convexităţii 11.3.1. Definiţie : O funcţie f : I → R este convexă pe intervalul I ⊆ R dacă oricare ar fi x1 , x 2 ∈ I , ∀ λ ∈ [0,1] are loc inegalitatea: f (λ x 1 + (1 − λ ) x 2 ) ≤ λ f ( x 1 ) + (1 − λ ) f ( x 2 ) . Dacă inegalitatea este de sens contrar, funcţia se numeşte concavă. Dacă inegalităţile precedente sunt stricte, atunci spunem că f este strict convexă ( strict concavă). 11.3.2. Observaţie : Funcţia f este concavă pe intervalul I dacă şi numai dacă –f este convexă. 11.3.3. Teoremă (Jensen): Fie I ⊆ R un interval, iar f : I → R o funcţie. Atunci f este convexă dacă şi numai dacă oricare ar fi n ∈ N , n ≥ 2 , x1 , x 2 , ... , x n ∈ I şi λ 1 , λ 2 ,..., λ n ≥ 0 , cu λ 1 + λ 2 + ... + λ n = 1 , are loc: f (λ1 x1 + λ 2 x 2 + ... + λ n x n ) ≤ λ1 f ( x1 ) + λ 2 f ( x 2 ) + ... + λ n f ( x n ) . 11.3.4. Propoziţie : a) Produsul dintre o funcţie convexă şi o funcţie constantă pozitivă este o funcţie convexă. b) O sumă de funcţii convexe este o funcţie convexă. c) Dacă g : I → J este convexă pe intervalul I, iar f : J → R este convexă şi crescătoare pe intervalul J, atunci f o g este convexă. d) Dacă f : I → J este inversabilă pe intervalul I, iar g : J → I este inversa sa, atunci: 1) f convexă şi crescătoare ⇒ g concavă şi crescătoare 2) f convexă şi descrescătoare ⇒ g convexă şi descrescătoare
277
e) Dacă f : I → R este convexă şi neconstantă pe intervalul I, atunci f nu-şi poate atinge valoarea cea mai mare în interiorul intervalului. Demonstraţie : Punctele a) şi b) se verifică imediat. Demonstrăm c). Din g convexă pe I, rezultă g ((1 − t ) x1 + tx 2 ) ≤ (1 − t ) g ( x1 ) + tg ( x 2 ) , oricare ar fi x1 , x 2 ∈ I , ∀ t ∈ [0,1]. Cum f este crescătoare şi convexă, rezultă: ( f o g )( (1 − t ) x1 + tx 2 ) ≤ f ((1 − t ) g ( x1 ) + tg ( x 2 ) ) ≤ (1 − t ) ( f o g )( x1 ) + t ( f o g )( x 2 ) , deci f o g este convexă. Atenţie : Compusa a două funcţii convexe nu este neapărat o funcţie convexă. Contraexemplu: Fie g : [− 1,1] → [0,1], g ( x) = x 2 , iar f : [0,1] → R, f ( x) = − x . Deci f şi g sunt convexe, dar ( f o g )( x) = − x 2 nu este convexă. d) Demonstrăm numai 1). Dacă f este crescătoare, atunci şi g = f −1 este crescătoare. Arătăm că g este concavă. Pentru y1 y 2 ∈ J există x1 , x 2 , x ∈ I astfel încât f ( x1 ) = y1 , f ( x 2 ) = y 2 , f ( x) = (1 − t ) y1 + ty 2 . Din f convexă rezultă: f ((1 − t ) x1 + tx 2 ) ≤ (1 − t ) f ( x1 ) + tf ( x 2 ) = (1 − t ) y1 + ty 2 . Dar f este (1 − t ) x1 + tx 2 ≤ x , adică crescătoare şi de aici avem: (1 − t ) g ( y1 ) + tg ( y 2 ) ≤ g ((1 − t ) y1 + ty 2 ) , adică g este concavă. e) Demonstrăm prin reducere la absurd. Presupunem că f îşi atinge cea mai mare valoare în x0 din interiorul intervalului I. Deci există x1 , x 2 ∈ I astfel încât x1 < x0 < x 2 şi f ( x1 ) < f ( x0 ) , f ( x 2 ) < f ( x0 ) . Punem x0 = (1 − t ) x1 + tx 2 . Înmulţind prima inegalitate cu (1-t) şi a doua cu t şi adunăm: (1 − t ) f ( x1 ) + tf ( x 2 ) < f ( x0 ) = f ( (1 − t )x1 + tx 2 ) , relaţie care contrazice convexitatea lui f. 11.3.5. Propoziţie : Dacă funcţia f : I → R este strict convexă pe intervalul I, iar g : I → R este o funcţie liniară, atunci ecuaţia f ( x) = g ( x) are cel mult două soluţii pe intervalul I. Demonstraţie : Admitem că există cel puţin trei soluţii diferite x1 , x 2 , x3 . Fie
x3 ∈ ( x1 , x 2 ) . Atunci există λ ∈ (0 ,1) astfel încât: x 3 = λ x1 + (1 − λ ) x 2 . Dar f ( x 3 ) = g ( x 3 ) = λg ( x1 ) + (1 − λ )g ( x 2 ) = λf ( x1 ) + (1 − λ ) f ( x 2 ) . Contradicţie cu f strict convexă.
278
Bibliografie
1. 2. 3. 4. 5. 6. 7.
Berinde V., explorare, investigare şi descoperire în matematică, Editura Efemeride, Baia Mare, 2001 Burtea M., Burtea G., Mateatică, clasa a XI-a, Elemente de analiză matematică, Editura Carminis, Piteşti, 2001 Ganga M., Ecuaţii şi inecuaţii, Editura Mathprss, Ploieşti, 1998 Gorgotă V., Şerdean I., Ulmeanu S., Matematica în concursurile şcolare 2002, IX-XII, Editura Paralela 45, 2002 Suceveanu V., Copaceanu R., Metode nestandard de rezolvare a ecuaţiilor, Foaie Matematică, Nr. 3 şi Nr. 4, 1999, Chişinău Tămâian T., Probleme selectate din reviste selecte, Editura Cub Press, Baia Mare, 2002 Universitatea Tehnică ,Cluj−Napoca, Teste grilă de matematică, admitere 2003, U.T. Pres, Cluj –Napoca, 2002.
279
Probleme propuse R11.1.1 Să se rezolve ecuaţia: x 3 − 6 x 2 + 3 x + 6 x ln x + 2 = 0, x > 0 . Soluţie : Considerăm funcţia f : (0, ∞ ) → R , f ( x) = x 3 − 6 x 2 + 3 x + 6 x ln x + 2 . ( x − 1) 2 Atunci f ( x) = 3x − 12 x + 6 ln x + 6 şi f ( x) = 6 ≥ 0 , pentru orice x x ∈ (0, ∞ ) . Variaţia funcţiei f este redată în tabelul următor: '
''
2
x
0
1
f ' ' ( x)
+ + + + 0 + + + +
f ' ( x)
- - - -0 + + + +
f (x)
0
Deducem că x = 1 este unica soluţie. R11.1.2 Rezolvaţi ecuaţia: 4 Soluţie : Pentru x < 0, 4
x+
1 x
+9
x+
x+
1 x
1 x
+9
x+
1 x
= 275.
< 2 , deci ecuaţia nu are soluţii.
Fie x > 0 . considerăm funcţia f a : (0, ∞ ) → R,
f a ( x) = a
x+
1 x
, a > 1 . Atunci 1 fa = g o h , h : (0, ∞ ) → [2, ∞ ), h( x) = x + , iar unde x g : [2, ∞ ) → R, g ( x) = a x . Se constată că h este strict descrescătoare pe (0,1] şi strict crescătoare pe [1, ∞ ) , iar g este strict crescătoare. Atunci (din propoziţia 11.1.3) deducem cü funcţia f a este strict descrescătoare pe (0,1] şi strict [1, ∞ ) . crescătoare pe Funcţia x+
1
x+
1
F : (0, ∞ ) → R, F ( x) = 4 x + 9 x = f 4 ( x) + f 9 ( x) este strict descrescătoare pe (0,1] şi strict crescătoare pe [1, ∞ ) . În concluzie, ecuaţia: F(x)=275 are cel 280
mult câte o soluţie pe intervalele (0,1] , respectiv [1, ∞ ) . Dar x = x = 2 ∈ [1, ∞ ) sunt soluţii.
Deci x =
1 ∈ (0,1] şi 2
1 şi x = 2 sunt singurele soluţii ale 2
ecuaţiei date. R11.1.3 Să se rezolve în R ecuaţia: Soluţie :
( 3)
x
− 2 x −1 = 1 .
( )
x
f : R → R, f (x) = 3 − 2 x 1 f ' : R → R , f ' ( x ) = 3 ln 3 − 2 x ln 2 2 ln 2 x 0 = log 3 . Se verifică că x0 ∈ (2,4) . ln 3 2
Fie
( )
x −1
.
Atunci cu
rădăcina
Variaţia funcţiei f dată de prima derivată este redată în tabloul:
x f ' ( x) f (x)
−∞ +
x0
2 +
+
0
∞
4 -
-
-
f ( x0 )
Deci f este strict crescătoare pe (− ∞, x0 ] şi strict descrescătoare pe [x0 , ∞ ) . Din teorema 11.1.4 deducem că ecuaţia f ( x) = 0 are cel mult câte o soluţie pe fiecare din intervalele (− ∞, x0 ] , respectiv (x 0 , ∞ ) . Se verifică că x =
(
)
2 ∈ − ∞, x0 şi x = 4 ∈ (x 0 , ∞ ) sunt soluţii, deci acestea sunt singurele soluţii ale ecuaţiei date.
R11.1.4 Să se rezolve ecuaţia: e x −1 = x ln x + 1 , x ∈ R+* . Soluţie : Funcţia f : (0, ∞ ) → R, f ( x) = e x −1 − x ln x − 1 are derivatele 1 1 f ' ( x) = e x −1 − ln x − 1 , f ' ' ( x) = e x −1 − , f ' ' ' ( x) = e x −1 + 2 > 0 . Rezultă că f ' ' x x 281
este strict crescătoare, aşadar x = 1 este unica soluţie a ecuaţiei f ' ' ( x) = 0 . Cum f ' (1) = 0 , rezultă că f ' ( x) > 0 pentru x ∈ (0,1) şi f ' ( x) > 0 pentru x ∈ (1, ∞ ) , deci f este strict crescătoare pe (0, ∞ ) . Cum f (1) = 0 , ecuaţia dată are unica soluţie x=1.
R11.2.1
π x sin , dacă x ∈ (0,1] Se consideră funcţia. f : [0,1] → R, f ( x) = . x 0, dacă x = 0
1 1 , , n ∈ N * , să se arate Aplicând teorema lui Rolle pe fiecare interval n +1 n că ecuaţia tgx = x are soluţii pe fiecare interval (nπ , (n + 1)π ) . Soluţie : Se verifică că f este continuă pe [0,1], derivabilă pe (0,1) şi π π π 1 1 f ' ( x) = sin − cos , ∀ x ∈ (0,1] . Cum f = f = 0 , suntem în x x x n n +1 1 1 , astfel încât condiţiile din teorema lui Rolle, deci există c n ∈ n +1 n f ' (c n ) = 0 , adică: sin
π
cn
−
π
cn
cos
π
cn
= 0 . Obţinem tg
π
cn
=
π
cn
, deci
π
cn
este
π 1 1 , , avem soluţie a ecuaţiei tgx = x . Cum c n ∈ ∈ (nπ , (n + 1)π ) , cn n +1 n pentru orice n ∈ N * . R11.2.2 Să se rezolve în R ecuaţia: 2 x + 3 x + 6 x = 3x 2 + 5 x + 3 . Soluţie : Observăm că ecuaţia are soluţiile x1 = −1, x 2 = 0, x3 = 1 . Arătăm că acestea sunt singurele soluţii. Considerăm funcţia f : R → R ,
f ( x) = 2 x + 3 x + 6 x − 3x 2 − 5 x − 3 . Presupunem că există x 4 ∉ {− 1,0,1} astfel încât f ( x 4 ) = 0 . Conform teoremei lui Rolle, f ' ( x) = 0 ar avea câte o soluţie
282
pe fiecare interval cu capetele soluţii consecutive ale lui f ( x) = 0 . Deci f ' ar avea cel puţin 3 soluţii diferite. De aici, f ' ' ( x) = 0 ar avea cel puţin două soluţii reale, iar f ' ' ' ( x) = 0 ar avea cel puţin o soluţie reală. Dar f ' ' ' ( x) = 2 x (ln 2) + 3 x (ln 3) + 6 x (ln 6) > 0, ∀ x ∈ R , deci presupunerea făcută este falsă. 3
3
3
R11.2.3 Rezolvaţi ecuaţia: 3 x + 6 x = 4 x + 5 x . Soluţie : 6 x − 5x 4 x − 3x = Ecuaţia se scrie . Considerăm funcţia f (t ) = t x , 6−5 4−3 t > 0 , căreia îi aplicăm teorema lui Lagrange pe intervalele [3,4] şi [5,6]. Deducem că există t1 ∈ (3,4) şi t 2 ∈ (5,6 ) pentru care 4 x − 3 x = xt1x −1 şi 6 x − 5 x = xt 2x −1 . Atunci ecuaţia se mai scrie: xt1x −1 = xt 2x −1 sau echivalent x t 2x −1 − t1x −1 = 0 . Obţinem x1 = 0 sau t 2x −1 = t1x −1 . Cum t 2 > t1 , din
(
)
t2 t1
x −1
= 0 rezultă x 2 = 1 . Soluţiile ecuaţiei sunt x1 = 0 şi x 2 = 1 .
R11.2.4 Rezolvaţi ecuaţia: (x + 1) ⋅ 3 x = 2 x + x ⋅ 4 x . Soluţie : 3x − 2 x x ⋅ 4 x − x ⋅ 3x Scriem ecuaţia sub forma . Notăm = 3− 2 4−3 f : [2,3] → R, f (t ) = t x şi g : [3,4] → R, g (t ) = xt x . Din teorema lui Lagrange astfel ca f ' (a) = g ' (b) , de unde rezultă că există a ∈ (2,3), b ∈ (3,4 ) x −1
a a xa = x b . Rezultă x1 = 0 sau a = xb . Din x = şi 0 < < 1 . b b Obţinem x 2 = 1 . În concluzie, soluţiile ecuaţiei sunt x1 = 0 şi x 2 = 1 . x −1
2
R11.2.5
x −1
Să se arate că ecuaţia
(2π , 3π ) cel puţin o soluţie.
x −1
x −1
1 1 cos x − =0 2 ( x + 1) 2
283
are în intervalul
Soluţie : Considerăm
funcţia
f ( x) = sin x −
x −1 , x ≥ 0. x +1
Avem
5π 5π f (3π ) < 0 . Deci există x1 ∈ 2π , şi f (2π ) < 0, f > 0 şi 2 2 5π x 2 ∈ ,3π astfel încât f ( x1 ) = f ( x 2 ) = 0 . Rezultă din teorema lui Rolle că 2 2 , obţinem există x0 ∈ ( x1 , x 2 ) cu f ' ( x0 ) = 0 . Cum f ' ( x) = cos x − ( x + 1) 2 rezultatul din enunţ.
R11.3.1 Să se rezolve în N: x x x x x a + (a + 2) + (a + 6) = (a + 1) + (a + 3) + (a + 4) , unde a > 1 . Soluţie : Evident x = 0 şi x = 1 sunt soluţii. Arătăm că ecuaţia nu are alte soluţii. Funcţia f : [0, ∞ ) → R, f (t ) = t n , unde n ∈ N , n ≥ 2 este strict convexă. Atunci x
n
an + bn a + b din definiţie obţinem: > , pentru a, b > 0 , a ≠ b . Deci: 2 2 x
a x + (a + 2) x 2 a + 2 x > = ( a + 1) 2 2
(a + 2)x + (a + 6) x 2
(a + 6 )
x
+ ax
x
2a + 8 x > = (a + 4) 2 x
2a + 6 x > = ( a + 3) 2
2 Adunând aceste relaţii, obţinem: x a + (a + 2) x + (a + 6) x > (a + 1) x + (a + 3) x + (a + 4) x . Deci ecuaţia nu are alte soluţii. 1
R11.3.2 Fie a > 1, a fixat. Să se rezolve în R ecuaţia: a x + a x = a 2 + a .
284
Soluţie : Funcţia f : R → (0, ∞ ), f ( x) = a x este convexă şi crescătoare pe R. Funcţia g : (0 , ∞ ) → R , g ( x ) = a
1 x
este convexă pe (0 , ∞
) , deoarece
1 x
1 1 a 2 + ln a ln a > 0 , pe (0 , ∞ ) . Rezultă că f + g este convexă 3 x x pe (0 , ∞ ) , prin urmare ecuaţia dată are cel mult două soluţii în (0 , ∞ ) . 1 Acestea sunt 2 şi . În intervalul (− ∞,0 ) , ecuaţia nu are soluţii deoarece 2 g ' ' ( x) =
1 x
a + a < 1 + 1 < a 2 + a , oricare ar fi x ∈ (− ∞,0 ) . x
R11.3.3 Să se rezolve ecuaţia: (2 x + 4) ⋅ 4 x − (2 x 2 + 6 x + 5) ⋅ 2 x + x + 1 = 0 . Soluţie : Ecuaţia se scrie în formă echivalentă: ( x + 2 ) ⋅ 2 x +1 − 1 2 x − ( x + 1) = 0 . Obţinem: (x + 2) ⋅ 2 x +1 = 1 sau 2 x = x + 1 . Ecuaţia (x + 2) ⋅ 2 x +1 = 1 nu are soluţii 1 cu soluţie unică pe (− ∞,−2] , iar pe (− 2, ∞ ) ecuaţia se scrie 2 x +1 = x+2 x1 = −1 , deoarece membrul stâng este o funcţie strict crescătoare, iar membrul drept este o funcţie strict descrescătoare. Ecuaţia 2 x = x + 1 are soluţiile x 2 = 0 şi x3 = 1 şi nu mai are altele deoarece graficul unei funcţii strict convexe şi o dreaptă au cel mult două puncte distincte comune (propoziţia 11.3.5). În concluzie, ecuaţia dată are soluţiile: x1 = −1 , x 2 = 0 şi x3 = 1 .
[
285
][
]
12. Exemple şi contraexemple în analiza matematică Exemplele şi contraexemplele în matematică reprezintă de multe ori răspunsuri la o intensă dorinţă de a pune de acord intuiţia cu rigoarea raţionamentului ştiinţific. Este verificat însă că intuiţia ne joacă, nu de puţine ori, feste şi că exemple născute în urma unor eforturi îndelungate sau din contră apărute ca o revelaţie, spulberă ceea ce era aproape evidenţa însăşi. Alteori exemplele şi contraexemplele demonstrează că anumite rezultate nu pot fi substanţial îmbunătăţite dacă se slăbeşte prea mult ipoteza, derivând de aici necesitatea ca teoria să fie aplicată şi utilizată cu extremă exactitate. În cele ce urmează vor fi prezentate unele rezultate de analiză, ele însele interesante sau care conduc uneori la concluzii surprinzătoare. 12.1. Completări şi precizări teoretice Despre şiruri de numere raţionale convergente. Se ştie că orice număr real este limită a unui şir de numere raţionale. Astfel, dacă un şir cu termenii numere raţionale converge la un număr iraţional, şirul numitorilor sau al numărătorilor termenilor poate fi mărginit ? Dar dacă şirul este neconstant şi converge la un număr raţional ? 12. 1. 1. Propoziţie Dacă (rn ) n≥1 este un şir de numere raţionale pn , pn ∈ , qn ∈ rn = qn (qn ) n ≥1 are limita +∞.
*
, convergent la un număr iraţional
x0, atunci
Demonstraţie: Presupunem că şirul (qn ) n ≥1 nu are limita +∞. El admite atunci un subşir constant nenul (qkn ) n ≥1 . Şirul ( pkn ) n ≥1 este un şir de numere
întregi care nu poate să aibă limita –∞ sau +∞
( altfel şirul (rkm ) n≥1 ar avea
limita –∞ sau +∞ şi nu x0 cum are de fapt). Rezultă că şi şirul ( pkn ) n ≥1 admite un subşir constant. Se obţine că şirul (rn ) n≥1 admite un subşir constant.
Acest subşir are o limită număr raţional ceea ce contrazice ipoteza că ( rn )n≥1 este
convergent la numărul iraţional x0. Rezultă că presupunerea făcută a fost falsă şi deci (qn ) n ≥1 are limita +∞. Un rezultat analog se poate preciza şi pentru şirul modulului numărătorilor. Într-un limbaj mai puţin exact, am demonstrat că pentru ca un număr iraţional să poată fi aproximat cu o eroare din ce în ce mai mică, cu ajutorul 286
unor numere raţionale, acestea din urmă vor trebui să aibă numitori şi numărători din ce în ce mai mari. p 12. 1. 2. Propoziţie Fie (rn ) n≥1 un şir de numere raţionale rn = n , qn convergent la un număr raţional x0. Dacă (qn ) n ≥1 este mărginit, atunci şirul (rn ) n≥1 este constant începând cu un anumit rang. Demonstraţie: Din imaginea şirului (qn ) n ≥1 , care este finită, reţinem doar mulţimea A formată din acele numere naturale nenule care sunt valori a unui număr infinit de termeni ai acestui şir. Eliminăm termenii şirului (qn ) n ≥1 care nu aparţin mulţimii A. Numărul acestor termeni este evident finit. Există aşadar n0 ∈ * asfel încât qn ∈ A , (∀) n ≥ n0 . Şirul (qn ) n ≥ n0 poate fi acum „împărţit în totalitate” într-un număr finit de
pn ∈ , qn ∈
*
subşiruri constante care au valorile termenilor din A. Fie (qn ) n ≥ n0 un astfel de subşir constant egal cu α. Subşirul ( pkn ) n ≥ n0 este convergent la α ⋅ x0 şi are toţi termenii numere întregi, rezultând că şi acest subşir este constant începând cu un anumit rang n1 ≥ n0 . Atunci şirul (rkn ) n ≥ n1 este constant, constanta neputând fi decât x0. Se procedează similar cu toate subşirurile care au valorile termenilor în A. 12. 1. 3. Corolar. Dacă (rn ) n≥1 este un şir de numere raţionale pn , pn ∈ , qn ∈ * convergent la un număr raţional rn = qn * rn ≠ x0 , (∀) n ∈ , atunci (qn ) n ≥1 are limita +∞.
x0 şi dacă
Proprietăţi de continuitate ale unor funcţii.
Intuitiv, continuitatea ca interpretare geometrică este percepută, în cele mai multe dintre cazuri, ca fiind proprietatea în urma căreia graficul unei funcţii poate fi trasat fără a ridica creionul de pe hârtie. Astfel este uşor să construim funcţii f : → care au un singur punct de discontinuitate, modificând într-un singur punct valoarea unei funcţii continue. Faptul că realitatea legată de funcţiile continue este mai complexă este relevat de exemple ale unor funcţii continue într-un singur punct. Se pot
287
construi nenumărate exemple de acest fel dacă avem în vedere următorul rezultat: 12. 1. 4. Propoziţie Dacă f1 , f 2 : → , sunt două funcţii continue, f ( x) , dac ã x ∈ , f ( x) = 1 f 2 ( x) , dac ã x ∈ dacă şi numai dacă f1 ( x0 ) = f 2 ( x0 ) .
atunci funcţia f :
→
\
este continuă în x0
Ne întrebăm în mod firesc, cât de multe pot fi punctele de discontinuitate ale unei funcţii ? 12. 1. 5. Propoziţie Există funcţii care sunt discontinue în orice punct al domeniului lor de definiţie. Demonstraţie: Funcţia lui Dirichlet f : → , 1, dac ã x ∈ f ( x) = 0, dac ã x ∈ \ puncte de discontinuitate de speţa a II-a. are toate punctele din 12. 1. 6. Propoziţie Există funcţii definite pe un interval I care să fie discontinue doar pe mulţimea numerelor raţionale din I. Demonstraţie: Funcţia lui Riemann f :[0,1] → , 0, dac ã x ∈ [0,1] \ sau x = 0 f ( x) = 1 p * sunt prime î ntre ele , q , dac ã x = q unde p, q ∈ este continuă în x = 0 şi în toate punctele iraţionale din [0, 1] şi este discontinuă în toate punctele raţionale nenule din [0, 1] Fie x0 ∈ [0,1] . Este suficient să considerăm în continuare (tn ) n ≥1 un şir de elemente din [0, 1], cu toţi termenii raţionali sau toţi iraţionali, diferiţi de x0, dar convergent la x0, p Dacă tn ∈ I [0,1], ∀ n ∈ * , iar tn = n , unde pn ∈ * , qn ∈ * , qn atunci, conform propoziţiei 12.1.1. şi corolarului 12.1.3. avem lim qn = +∞ . n →∞
1 Rezultă că lim f ( tn ) = lim = 0. n →∞ n →∞ q n Dacă tn ∈ [0,1] \ atunci lim f (tn ) = lim 0 = 0 . n →∞
n →∞
În condiţiile în care f ( x0 ) = 0 ( deci dacă x0 este 0 sau iraţional), funcţia f este continuă în x0. Evident dacă f ( x0 ) ≠ 0 (deci dacă x0 este raţional nenul) funcţia f nu este continuă în x0.
288
Aşadar concluzia propoziţiei este adevărată dacă se consideră restricţia funcţiei Riemann la (0, 1] 12. 1. 7. Observaţie Funcţia lui Riemann este peste tot nederivabilă. Demonstraţie: Vom arăta pentru început că funcţia Riemann este nederivabilă în punctul 0. Dacă (tn ) n ≥1 este un şir cu termenii iraţionali, din [0, 1], convergent la 0, atunci: f (tn ) − f (0) 0−0 lim = lim =0 n →∞ n →∞ tn − 0 tn (1) 1 Şirul este format din termeni nenuli situaţi în [0, 1] şi este convergent la n n ≥1 0. Avem: 1 1 f − f (0) −0 n n lim = lim =1 n →∞ n →∞ 1 1 −0 −0 n n (2) Din relaţiile (1) şi (2) rezultă că funcţia f a lui Riemann nu are derivată în 0. În celelalte puncte raţionale din [0, 1] funcţia este nederivabilă, nefiind nici măcar continuă. Fie acum x0 un număr iraţional din [0, 1]. (tn ) n ≥1 este un şir cu termenii iraţionali, din [0,1] \{x0 } , Dacă convergent la x0, atunci: f (tn ) − f ( x0 ) 0−0 lim = lim =0. n →∞ n →∞ t − x tn − x0 n 0 (3) [10n ⋅ x0 ] Fie (tn ) n ≥1 , unde tn = ( (tn ) n ≥1 este de fapt şirul aproximărilor 10n lui x0 cu n zecimale exacte). Se demonstrează uşor că (tn ) n ≥1 este din [0, 1] 1 şi că este convergent la x0. De asemenea 0 < x0 − tn < n . 10
289
Deoarece tn, scris ca mai înainte s-ar putea să nu fie o fracţie p ireductibilă, rezultă că scriindu-l ca fracţie ireductibilă tn = n , unde qn pn ∈
*
, qn ∈
*
, avem qn ≤ 10n . Obţinem astfel:
1 −0 f (tn ) − f ( x0 ) qn 1 1 = = > =1. tn − x0 tn − x0 qn ( x0 − tn ) 10n ⋅ 1 10n
f (tn ) − f ( x0 ) chiar dacă există nu poate fi egală cu 0. n →∞ tn − x0 Ţinând seama şi de relaţia (3), rezultă că f nu admite derivată în x0. Deducem că
lim
Continuitatea şi proprietatea lui Darboux.
Este cunoscută „apropierea” dintre noţiunea de continuitate a unei funcţii pe un interval şi proprietatea lui Darboux. La o analiză mai aprofundată însă diferenţele dintre ele pot deveni surprinzător de mari. Convenim ca în continuare, prin interval, să înţelegem interval nedegenerat. Este clasic următorul rezultat: 1 sin , dac ã x ≠ 0 este 12. 1. 8. Propoziţie Funcţia f : → , f ( x) = x α , dac ã x = 0 discontinuă în x = 0. Ea are proprietatea lui Darboux dacă şi numai dacă α ∈ [−1,1] . Cât de “bogată” poate fi mulţimea punctelor de discontinuitate ale unei funcţii care are proprietatea lui Darboux ? Un posibil răspuns este conţinut în : 12. 1. 9. Propoziţie Există funcţii cu proprietatea lui Darboux şi care sunt discontinue în toate punctele intervalului de definiţie. Demonstraţie: Exemplul pe care îl vom prezenta i se datorează, într-o formă uşor modificată, matematicianului francez Henri Lebesgue. Amintim că orice x∈[0,1) admite o scriere în baza 2 fără perioada 1 şi în plus putem conveni că 1 = 0,1111K . Considerăm funcţia f :[0,1] → [0,1] definită astfel: pentru fiecare x ∈ [0,1] scris în baza 2 sub forma x = 0, a1a2 a3 K 0 , dac ã (∀) k ∈ º irul (a2 n +1 ) n≥ k nu este periodic f ( x) = 0, a2 k + 2 a2 k + 4 a2 k + 6 K , dac ã º irul (a2 n +1 ) n≥ k este periodic cu rangul k .
290
În continuare vom arăta mai mult decât că f are proprietatea lui Darboux şi anume că pentru orice a, b ∈ [0,1], a < b are loc f ( [a, b] ) = [0,1] . Deoarece a < b , ele vor avea scrierea binară: a = 0, u1u2 K us 0α1α 2 Kα t 0K b = 0, u1u2 K us 1K , (dacă s = 0 sau t = 0 , dispar cifrele u1u2 K us respectiv
unde s, t ∈ α1α 2 Kα t ). În scrierea lui a apar o infinitate de cifre 0, deoarece din a < b , rezultă a < 1 , iar 1 este singurul număr care am convenit că are perioada 1. Fie acum un λ ∈ [0,1], λ = 0, λ1λ2λ3 K . Alegem c = 0, u1u2 K us 0α1α 2 Kα t 110{ K 0 λ1 0λ2 0λ3 K , unde p ori
p ∈ {1, 2} este ales astfel încât cifra 0 din faţa cifrei λ1 să fie de rang impar în cadrul şirului cifrelor de după virgulă. Vom nota cu 0 această cifră 0. În scrierea lui c, şirul cifrelor de rang impar de după virgulă este: u1 , u3 ,K ,1, 0, 0, 0,K Acest şir este periodic începând cu 0, fiind constant nul. Nu poate fi periodic începând cu un termen de rang inferior, deoarece cifra 1 din fata cifrei 0 nu se regăseste în termenii de rang superior. Rezultă f (c) = 0, λ1λ2λ3 K = λ . Mai avem: a = 0, u1u2 K us 0α1α 2 Kα t 0K c = 0, u1u2 K us 0α1α 2 Kα t 1K
b = 0, u1u2 K us 1K şi deci c ∈ [a, b] . λ fiind arbitrar în [0, 1], rezultă f ( [a, b] ) = [0,1] . Aşadar f are proprietatea lui Darboux. Mai mult, rezultă că pentru orice vecinătate V a unui număr x0 ∈ [0,1] are loc f (V I [0,1]) = [0,1] obţinându-se de aici că f nu este continuă în x0. x0 fiind arbitrar, rezultă că f nu este continuă în nici un punct al domeniului de definiţie. 12. 1. 10. Corolar Există funcţii w : → , care transformă orice interval în , (aşadar funcţia w este nemărginită pe orice interval) Demonstraţie: Considerăm f :[0,1] → [0,1] funcţia definită anterior şi funcţiile:
291
1 1 + arctg x , 2 π 0 , dac ã x = 0 sau x = 1 . ψ :[0,1] → ,ψ ( x) = π tg π x − 2 , dac ã x ∈ (0,1). Evident funcţia ϕ este continuă, strict crescătoare, iar funcţia ψ este surjectivă. Fie w : → , w = ψ o f o ϕ . Pentru orice interval I ⊆ , J = ϕ ( I ) este interval şi de aici w( I ) = ψ o f o ϕ (1) = ψ ( f (ϕ ( I ))) = ψ ( f ( J )) = ψ ([0,1]) = . Se cunoaşte comportarea aleatorie în raport cu operaţiile algebrice a funcţiilor cu proprietatea lui Darboux, acestea fiind stabile doar în raport cu compunerea funcţiilor (acolo unde compunerea se poate efectua). Ne putem întreba ce se întâmplă dacă se întăresc cu puţin proprietăţile măcar a uneia dintre funcţii. 12. 1. 11. Propoziţie Există funcţii u , v : → , u continuă şi v cu proprietatea lui Darboux astfel încât u + v nu are proprietatea lui Darboux. Demonstraţie: Considerăm funcţia w definită în Corolarul 12.1.10. Reamintim că pentru orice interval I ⊆ , w( I ) = . (1) Fie A = { x ∈ w( x) = x} . Definim funcţia v : → ,
ϕ:
→ [0,1], ϕ ( x) =
w( x) , dac ã x ∈ \ A v( x) = 1 + x , dac ã x ∈ A . Aşa definită, funcţia v are proprietatea că v( x) ≠ x , (∀) x ∈ . Vom arăta că v are proprietatea lui Darboux demonstrând că (∀) a, b ∈ , a < b , v((a, b)) = . Fie pentru aceasta a, b ∈ , a < b şi fie y ∈ . Din relaţia (1) deducem că există x ∈ (a, b) astfel încât w( x) = y . Dacă x ∈ \ A , atunci obţinem: (2) v( x) = y Dacă x ∈ A , atunci considerăm întervalul (x, b), rezultând din (1) că există t ∈ ( x, b) astfel încât w(t ) = y . Deoarece avem t ≠ x = w( x) = y = w(t ) , rezultă t ∉ A şi de aici v(t ) = w(t ) = y (3) Din (2) şi (3) rezultă că există x sau t în intervalul (a, b) astfel încât v( x) = y sau v(t ) = y , adică v( (a, b) ) = . Considerăm acum u : → , u ( x) = − x , funcţie care este evident continuă. 292
Deoarece v( x) ≠ x , (∀) x ∈ , rezultă că funcţia u + v nu se anulează. Alegem x1 < 0 astfel ca v( x1 ) > 0 şi x2 < 0 astfel ca v( x2 ) < 0 . Avem: (u + v)( x1 ) = − x1 + v( x1 ) > 0 (u + v)( x2 ) = − x2 + v( x2 ) < 0 şi cum u + v nu se anulează, rezultă că u + v nu are proprietatea lui Darboux.
Bibliografie 1. V., Neagu, Contraexemple în analiza matematică pentru licee, Foaia Matematică, Chişinău, 1/1996 2. E., Popa, Probleme de analiză matematică pentru clasele XI-XII, Editura Moldova, Iaşi, 1995 3. B.R., Gelbaum, J.M.H. Olmsted, Contraexemple în analiză, Editura Ştiinţifică, Bucureşti, 1973 4. O., Koneth, Greşeli tipice în analiza matematică,
293
12.2. Contraexemple sub formă de probleme rezolvate Pornind de la unele “evidente intuitive” vom formula câteva probleme de existenţă a unor funcţii cu anumite proprietăţi “patologice” care au în mod surprinzător răspuns pozitiv. Construcţia unei funcţii “anormale”, cum este şi funcţia lui Riemann a apărut la începutul fundamentării analizei matematice. Un tip de astfel de funcţii sunt funcţiile continue peste tot şi nederivabile în nici un punct. Primul exemplu de acest fel a fost dat de Weierstrass în jurul anului 1875. De atunci s-au construit numeroase exemple: Hardy (1916), Besicovitch (1922), Van der Werden (1930) şi alţii. R12.2.1. Există funcţii nemărginite în orice interval? Funcţiile elementare şi funcţiile obţinute prin compuneri sau operaţii cu funcţii elementare, cele care formează fondul principal de referinţă pentru funcţie, sunt nemărginite sau nemărginite spre ±∞ şi pot fi nemărginite în vecinătatea unor puncte în care avem asimptota verticală. Este greu de imaginat o funcţie care să fie nemărginită pe orice interval. Contraexemplu. Funcţia f : → , m n dac ã x ∈ , x = , (m, n) = 1, n > 0, f ( x) = n 0 dac ã x ∈ \ , este nemărginită pe orice interval (a, b) ⊂ . Dacă prin absurd f ar fi mărginită în intervalul (a, b) atunci toţi numitorii numerelor raţionale din acest interval ar fi mai mici decât un anumit număr natural M ∈ . Deoarece intervalul (a, b) este mărginit, trebuie ca şi numărătorii să fie mărginiţi şi fiind din , ei ar lua doar o mulţime finită de valori. În consecinţă în (a, b) am avea un număr finit de numere raţionale (contradicţie) R12.2.2. Există funcţie mărginită pe un interval închis, care nu are extreme locale? Se ştie că orice funcţie continuă definită pe un interval închis, îşi atinge maximul şi minimul, în particular pe orice subinterval închis ea admite maxime şi minime locale. Pare absurd că există funcţie mărginită dar care în nici un interval să nu admită puncte de extrem. Contraexemplu. Funcţia f :[0,1] → ,
(−1) n ⋅ n m , x ∈ , x = , (m, n) = 1, n > 0 f ( x) = n + 1 n 0 , x∈ \ . 294
Avem
f ( x) < 1, x ∈ [0,1] , mai precis imaginea oricărui interval [a, b] ⊂ [0,1]
cu a < b , este f ([a, b]) ⊂ (−1,1) , căci în jurul oricărui punct iraţional există şir ( xn ) n cu lim f ( xn ) = 1 şi şir ( yn ) n cu lim f ( yn ) = −1 , dar valorile 1 şi −1 nu se n →∞
n →∞
iau. R12.2.3. Daţi exemplu de funcţii transcendente şi demonstraţi transcendenţa lor. La clasele primare şi gimnaziale, elevii rămân cu senzaţia că numerele raţionale sunt “cele mai multe”, mult mai puţine par a fi numerele iraţionale algebrice (radicali) şi cu mult mai rare par a fi numerele transcendentale. Această impresie este complet eronată. De fapt, numerele raţionale şi numerele algebrice pot fi puse în bijecţie cu mulţimea numerelor naturale (pot fi ordonate într-un şir), adică sunt mulţimi numărabile, pe când mulţimea numerelor transcendete nu (este “mai mare”). Metodele de demonstrare a transcendenţei unor numere (e sau π ) sunt destul de grele şi, în general, specifice fiecărui număr. De aceea este interesant să punem în evidenţă şi să demonstrăm transcendenţa unor funcţii. Amintim câteva definiţii: Definiţia 1. Un număr real A este număr algebric dacă există un polinom f ∈ [ X ] , f = a0 + a1 X + a2 X 2 + K + an X n astfel ca
a0 + a1 ⋅ A + a2 ⋅ A2 + K + an ⋅ An = 0 . Un număr care nu este algebric se numeşte număr transcendent. Definiţia 2. O funcţie ϕ : → se numeşte funcţie algebrică dacă există o funcţie nenulă de forma P (u ) = a0 ( x) + a1 ( x) ⋅ u + K + an ( x) ⋅ u n unde a0 ( x), a1 ( x),K , an ( x) ∈ [ X ] sunt polinoame cu coeficienţi reali, astfel ca P (ϕ ( x)) = a0 ( x) + a1 ( x) ⋅ ϕ ( x) + K + an ( x) ⋅ (ϕ ( x)) n = 0 pentru orice x ∈ . Exemple. 1). Funcţia e x : → este funcţie transcendentă. Dacă prin absurd am avea o relaţie de forma a0 ( x) + a1 ( x) ⋅ e x + a2 ( x) ⋅ e2 x + K + an ( x) ⋅ enx = 0, x ∈ , trecând la limită x → −∞ obţinem lim a0 ( x) = 0 şi a0 fiind polinom, rezultă x →−∞
a0 = 0 . Apoi, împărţim în relaţie cu e x şi trecând din nou la limită rezultă a1 = 0 şi, inductiv, a2 = 0,K , an = 0 . 2) Funcţia sin : → este funcţie transcendentă.
295
Dacă a0 ( x) + a1 ( x) ⋅ sin x + a2 ( x) ⋅ sin 2 x + K + an ( x) ⋅ sin n x = 0, x ∈ . Pentru rezultă a0 (kπ ) = 0, k ∈ , deci polinomul a0 ar avea o x = kπ , k ∈ infinitate de rădăcini, rezultă a0 = 0 . Apoi, avem: sin x(a1 ( x) + a2 ( x) sin x + K + an ( x) sin n −1 x) = 0, x ∈
.
Deoarece sin x se anulează doar în punctele izolate A = {kπ k ∈
} funcţia
n −1
continuă a1 ( x) + a2 ( x) sin x + K + an ( x) sin x trebuie să se anuleze pe \ A , şi din construcţie ea este nulă peste tot. Inductiv se arată că a1 = 0, a2 = 0,K , an = 0 . R12.2.4. Există funcţii continue al căror produs este o funcţie care nu este uniform continuă? Se ştie că produsul a două funcţii continue este tot o funcţie continuă. Este de aşteptat ca şi produsul a două funcţii uniform continue să dea o funcţie uniform continuă. Contraexemplu. Funcţiile f : → , f ( x) = x şi g : → , g ( x) = sin x sunt uniform continue, dar funcţia produs h( x) = x ⋅ sin x nu este uniform continuă. Avem f ( x) − f ( y ) = x − y şi sin x − sin y ≤ x − y relaţii care asigură uniform continuitatea funcţiilor f şi g. Fie ε > 0 , presupunem că există δ ε > 0 , π δ ε ∈ 0, astfel ca: dacă 2
x − y < δ ε să avem
h( x) − h( y ) < ε . Luăm
1 x = y + δ ε şi y = 2nπ , n ∈ * şi avem 2 1 x − y = δ ε < δ ε , h( x) − h( y ) = x sin x − y sin y = 2 1 1 1 1 = 2nπ + δ ε sin δ ε = 2nπ + δ ε sin δ ε ≠ 0 2 2 2 2 1 1 şi pentru n suficient de mare 2nπ + δ ε sin δ ε > ε (contrar uniform 2 2 continuităţii). R12.2.5. Există funcţie monotonă, discontinuă într-o mulţime numărabilă densă? Intuitiv este greu de conceput un astfel de exemplu, deoarece în fiecare punct al unei mulţimi dense funcţia trebuie să facă un salt ascendent.
296
{
Exemplu. Fie A = an n ∈
putea lua A =
*
}⊂
o mulţime densă (în particular s-ar
care să ordoneze într-un şir). Pentru fiecare x ∈
considerăm
mulţimea Ax = {an ∈ A an ≤ x} , mulţime care poate fi finită sau infinită. Dacă Ax = {an1 , an2 ,K , ank ,K} atunci definim f ( x) =
1 1 1 + 2 + K + 2 dacă Ax este 2 n1 n2 nk
1 1 1 finită, sau f ( x) = lim 2 + 2 + K + 2 dacă Ax este infinită. Se demonstrează k →∞ n nk 1 n2 1 1 1 uşor că şirul hn = 1 + 2 + 2 + K + 2 este convergent şi atunci pentru orice n 2 3 1 1 1 n1 < n2 < K < nk < K şirul ck = 2 + 2 + K + 2 este convergent. Astfel n1 n2 nk funcţia f : → este bine definită şi discontinuă în punctele mulţimii A, în fiecare punct an avem un salt de mărimea sn = lim f ( x) − lim f ( x) . x
an
x
an
R12.2.6. Există funcţie f :[a, b] → continuă pe (a, b) şi derivabilă pe (a, b) cu f (a) = f (b) şi pentru care f ′( x) ≠ 0 pentru orice x ∈ (a, b) ? Teorema lui Rolle afirmă că dacă f :[a, b] → este: a) continuă pe [a, b] ; b) derivabilă pe (a, b) ; c) f (a) = f (b) , atunci există c ∈ (a, b) astfel ca f ′(c) = 0 . Se poate arăta că fiecare din condiţiile a), b), c) sunt necesare. Una din condiţiile la care s-ar părea că se poate renunţa este să cerem continuitatea doar pe intervalul (a, b) . Contraexemplu. Există funcţii f :[a, b] → , continue şi derivabile pe (a, b) cu f (a) = f (b) , pentru care f ′(c) ≠ 0 pentru orice c ∈ (a, b) . π Definim funcţia f : 0, → , 2 π sin x , x ∈ 0, 2 , f ( x) = 0 , x=π 2 π care îndeplineşte ipotezele contraexemplului dar f ′( x) = cos x ≠ 0 , x ∈ 0, . 2 297
R12.2.7. Există funcţie continuă doar într-un punct şi derivabilă în acest punct? x2 , x ∈ Exemplu. Funcţia f: → , . Avem f ( x) = 0 , x ∈ \
{
C( f ) = x ∈
}
x 2 = 0 = {0} ,
lim x↓0
f ( x) − f (0) x2 = lim = 0 , x →0 x x−0
deci
este
f
derivabilă în x0 = 0 şi f ′(0) = 0 . R12.2.8. Există funcţie derivabilă care are un punct de minim dar care nu este crescătoare pe nici un interval situat în dreapta punctului şi nici descrescătoare pe nici un interval din stânga punctului? 2 1 x sin + 2 , x ≠ 0 satisface Exemplu. Funcţia f : → , f ( x) = x 0 , x=0 proprietatea pentru x0 = 0 . 1 f ( x) − f (0) = x 2 sin + 2 > 0 pentru x ≠ 0 , deci punctul x x0 = 0 este un punct de minim absolut (global) pentru f. Funcţia f este derivabilă pe \{0} şi arătăm că este derivabilă şi în 0. f ( x) − f (0) 1 = lim x sin + 2 = 0 , deci f ′(0) = 0 . Arătăm Avem: lim x →0 x →0 x−0 x că în orice vecinătate (0, ε ) , situată la dreapta lui zero, există a, a′, b, b′ astfel ca a < a′ , b < b′ , f (a) < f (a′) şi f (b) > f (b′) (pe (0, ε ) f nu este nici crescătoare nici descrescătoare). Avem
Definim
şirurile
( yn ) n , ( z n ) n
prin
yn =
π
1
, zn =
+ nπ 6 convergente la zero, şi avem: y2 n +1 < z2 n +1 , y2 n < z2 n , n ∈ an = y2 n +1 , an′ = z2 n +1 , bn = y2 n , bn′ = z2 n . Avem 1 1 f (an ) = an2 2 − < (an′ ) 2 ⋅ 2 + = f (an′ ) 2 2 1 1 f (bn ) = bn2 2 + > (bn′ ) 2 ⋅ 2 − = f (bn′ ) . 2 2
298
π
1
,
+ nπ 6 şi definim: −
O clasă de funcţii cu proprietăţi surprinzătoare este clasa funcţiilor Hamel, funcţiile aditive ( f ( x + y ) = f ( x) + f ( y )) care nu sunt continue (nu sunt de forma f ( x) = a ⋅ x ). În capitolul de exerciţii funcţionale sunt demonstrate următoarele proprietăţi: P1. Dacă f : → este o funcţie aditivă şi neinjectivă, atunci pentru orice x0 ∈
, mulţimea { x ∈
f ( x) = f ( x0 )} este densă în
.
P2. Dacă f : → este o funcţie aditivă, surjectivă, atunci f este bijectivă sau f are proprietatea lui Darboux.
299
13. Ecuaţii funcţionale în analiza matematică Multe dintre ecuaţiile funcţionale care au fost studiate până în prezent, au apărut în mod natural, căutând funcţiile care verifică anumite proprietăţi dorite. În rezolvarea unei ecuaţii în care domeniul de definiţie şi codomeniul au şi structuri algebrice şi structuri topologice, metodele de algebră şi de analiză matematică se întrepătrund. Impunerea unor condiţii suplimentare asupra soluţiilor (derivabilitate, continuitate, monotonie) permite de multe ori determinarea tuturor soluţiilor dintr-o clasă de funcţii, soluţii care se caracterizează greu în caz general. 13.1. Ecuaţia lui Cauchy pe R Ecuaţia funcţională considerată de Cauchy încă înainte de anul 1900, pe cât de naturală, s-a dovedit deosebit de dificilă, părând că soluţia "scapă printre degete". Determinarea soluţiilor discontinue (nebanale) ale acestei ecuaţii a dat de lucru multor matematicieni. Munca lor a contribuit la dezvoltarea sau consolidarea unor domenii diverse ale matematicii: spaţii vectoriale, baze Hamel, cardinale, densitate, teoria măsurii, structuri algebrice, morfisme. Proprietăţile surprinzătoare ale funcţiilor aditive discontinue, oferă o mulţime de exemple de funcţii "patologice", multe din ele contrazicând intuiţia şi demonstrând necesitatea raţionamentului algebric abstract. Definiţia 13.1.1. Ecuaţia funcţională f :R → R (C ) : f ( x + y ) = f ( x) + f ( y ); x, y ∈ R se numeşte ecuaţia lui Cauchy iar soluţiile ei se numesc funcţii aditive. Teorema 13.1.2. Dacă f : R → R este o funcţie aditivă, atunci: (a) f (q) = qf (1) , pentru orice q ∈ Q (b) f (qx) = qf ( x) , pentru orice q ∈ Q şi x ∈ R (c) Funcţia g : R → R , g ( x) = f ( x) − f (1) ⋅ x , x ∈ R este funcţie aditivă şi restricţia ei la Q este g |Q = 0 .
Demonstraţie. Din condiţia f ( x + y ) = f ( x) + f ( y ) ; x, y ∈ R , prin inducţie rezultă f ( x1 + x2 + ... + xn ) = f ( x1 ) + f ( x2 ) + ... + f ( xn ) şi în particular f (nx) = nf ( x) ; n ∈ N f (0) = 0 f (−nx) + f (nx) = f (0) = 0 , deci f (−nx) = − nf ( x) . Deci f (kx) = kf ( x) ; k ∈ Z , x ∈ R . 300
x x x 1 x f ( x) = f + ... + = nf , deci f = f ( x) şi n n n n n m mx 1 f = f (mx) = f ( x) ; m, n ∈ Z , n ≠ 0 , x ∈ R , deci f (qx) = qf ( x) ; n n n x ∈ R , q ∈Q . Pentru x = 1 obţinem f (q) = qf (1) , q ∈ Q , deci punctele (a) şi (b) din teoremă sunt demonstrate. (c) Din (a) f (q) = qf (1) ; q ∈ Q , deci f (q) = f (q) − qf (1) = 0 . Avem g ( x + y ) = f ( x + y ) − ( x + y ) f (1) = f ( x) − xf (1) + f ( y ) − yf (1) = g ( x) + g ( y ) x, y ∈ R , deci g este aditivă. Observaţia 13.1.3. • Din (a) rezultă că restricţia la Q a unei funcţii aditive este perfect determinată de valoarea f (1) . (Dacă f : R → R şi g : R → R sunt funcţii aditive cu proprietatea f (1) = g (1) atunci f |Q = g |Q ).
Avem:
• Din punctul (c) rezultă că orice funcţie aditivă f : R → R este de forma f ( x) = g ( x) + ax , unde g : R → R este funcţia aditivă şi g |Q = 0 , deci clasa funcţiilor în care se caută soluţiile ecuaţiei lui Cauchy se poate restrânge la funcţiile ce au restricţia la Q, funcţia nulă. Teorema 13.1.4. Dacă g : R → R este o funcţie aditivă şi g |Q = 0 , atunci pentru orice interval nevid (a, b) ⊂ R avem: a) Dacă g este mărginită pe (a, b) , atunci g este mărginită pe R. b) g ((a, b)) = g (R ) . c) Dacă g este mărginită pe (a, b) , atunci g = 0 . d) Dacă g ≠ 0 , atunci mulţimea g ((a, b)) este densă în R. Demonstraţie. Afirmaţia a) este o consecinţă a afirmaţiei b). b) Fie y0 = g ( x0 ) ∈ Im g = g (R ) şi q un număr raţional din intervalul (a − x0 , b − x0 ) . Atunci x0 + q ∈ (a, b) şi g ( x0 ) + g (q ) = g ( x0 ) , deci y0 = g ( x0 + q ) ∈ g ((a, b)) . c) Presupunem prin absurd că există x0 ∈ R astfel ca g ( x0 ) ≠ 0 . Din g (nx0 ) = ng ( x0 ) , n ∈ N rezultă că mulţimea {g (nx0 ) | n ∈ N} este nemărginită, deci g (R ) este nemărginită şi din punctul a) rezultă că g este nemărginită pe ( a, b ) . d) Fie x0 ∈ R astfel ca g ( x0 ) ≠ 0 . Folosind punctul b) este suficient să arătăm că Im g = g (R ) este densă în R. Fie I ⊂ R un interval de lungime ε > 0 . Există n ∈ N astfel ca
301
1 1 g ( x0 ) < ε ⇔ g x0 < ε . n n 1 k Mulţimea kg x0 k ∈ Z = g x0 k ∈ Z formează o diviziune n n echidistantă a axei reale, cu distanţa între două noduri consecutive mai mică decât ε, deci în orice interval de lungime mai mică decât ε, în particular în I, k există un nod al diviziunii, deci există k ∈ Z astfel ca g x0 ∈ I . n Observaţia 13.1.5. Dacă g : R → R este o funcţie aditivă şi g |Q = 0 , atunci Im g = {0} sau Im g este o mulţime densă în R. Teorema 13.1.6. Dacă f : R → R este o funcţie aditivă şi are una din următoarele proprietăţi: a) f este mărginită pe un interval (a, b) ⊂ R b) f este local mărginită c) f este monotonă d) f este continuă atunci f ( x) = f (1) x, (∀) x ∈ R . Demonstraţie. a) Dacă f este mărginită pe (a, b) , atunci funcţia g : R → R , g ( x) = f ( x) − xf (1) este mărginită pe (a, b) şi din Teorema 1, punctul e), g este aditivă şi g |Q = 0 . Din teorema 2, punctul c) rezultă că g = 0 , deci f ( x) = xf (1) , x ∈ R . b) Dacă f e local mărginită, atunci pentru orice x0 ∈ R există un interval (a, b) ⊂ R astfel ca x0 ∈ (a, b) şi g este mărginită pe (a, b) , deci suntem în ipoteza a). c) Dacă f este monotonă şi a < b , atunci f ((a, b)) ⊂ f ([a, b]) = [ A, B] , unde A = min{ f (a), f (b)} şi B = max{ f (a), f (b)} , deci f este mărginită pe (a, b) şi suntem în ipoteza a). d) O funcţie continuă transformă intervale închise în intervale închise. Dacă a < b , atunci f ((a, b)) ⊂ f ([a, b]) = [ A, B] , unde A = min{ f ( x) | x ∈ [a, b]} şi B = max{df ( x) | x ∈ [a, b]} , deci f ((a, b)) este mărginită şi suntem în ipoteza a). Definiţia 13.1.7. O funcţie discontinuă f : R → R care verifică ecuaţiile Cauchy f ( x + y ) = f ( x) + f ( y ) , x, y ∈ R se numeşte funcţie Hamel.
302
Următoarea teoremă pune în evidenţă câteva proprietăţi "patologice" ale tuturor funcţiilor Hamel. Teorema 13.1.8. Dacă f : R → R este o funcţie Hamel şi a, b, c, d sunt numere reale cu a < b , c < d , atunci: (a) Mulţimea f ((a, b)) este densă în R. (b) Mulţimea f −1 ((c, d )) este densă în R. (c) Mulţimea G f ⊂ R 2 (graficul funcţiei f), este densă în R 2 . Demonstraţie. Fie funcţia g : R → R , g ( x) = f ( x) − xf (1) , x ∈ R , care este aditivă şi restricţia g |Q = 0 . Deoarece f este discontinuă (funcţie Hamel), există x0 ∈ R \ Q astfel ca g ( x0 ) = y0 ≠ 0 . Mulţimile {qy0 | q ∈ Q} şi {q'+ qx0 | q ∈ Q} sunt dense în R, deci oricare ar fi intervalele (c, d ) ⊂ R şi (a, b) ⊂ R , există q ∈ Q astfel ca qy0 ∈ (c, d ) şi există q'+ qx0 ∈ (a, b) . Avem g (q'+ qx0 ) = qy0 , deci mulţimea g ((a, b)) este densă în R. (a) Dacă f (1) = 0 , atunci f = g , deci f ((a, b)) = g ((a, b)) este densă. Dacă f (1) = k ≠ 0 , atunci mulţimea f ((a, b)) este densă, dacă şi numai 1 1 f ((a, b)) = f ((a, b)) este densă, deci putem presupune dacă mulţimea k k f (1) = 1 . Există un interval (a1 , b1 ) ⊂ (a, b) astfel ca b1 − a1 < d − c ⇔ c − a1 < d − b1 . Deoarece mulţimea g ((a1 , b1 )) este densă, există x0 ∈ (a1 , b1 ) astfel ca g ( x0 ) ∈ (c − a1 , d − b1 ) . Avem f ( x0 ) = g ( x0 ) + x0 ∈ (c − a1 + a1 , d − b1 + b1 ) = (c, d ) . (b) Din punctul (a), mulţimea f ((a, b)) este densă în R pentru orice a < b , deci f ((a, b)) ∩ (c, d ) ≠ ∅ ⇔ f −1 ((c, d )) ∩ (a, b) ≠ ∅ . (c) Din (a) şi (b) rezultă că pentru orice dreptunghi ( a , b ) × ( c, d ) ⊂ R × R , avem f ((a, b)) ∩ (c, d ) ≠ ∅ , deci G f ∩ ( a , b ) × ( c, d ) ≠ ∅ .
Observaţia 13.1.9. Dacă f : R → R este o funcţie aditivă, Kerf = {x ∈ R | f ( x) = 0} este nucleul funcţiei f, Im f = { f ( x) | x ∈ R} este imaginea funcţiei f, atunci: (a) Kerf = {0} sau Kerf este densă în R. (b) Im f = {0} sau Im f este densă în R. (c) Dacă f este neinjectivă ⇔ Kerf este densă în R. 303
(d) Dacă f este neinjectivă, atunci toate mulţimile de nivel N y = {x ∈ R | f ( x) = y} , y ∈ Im f , sunt dense în R.
Observaţia 13.1.10. Pe submulţimi ale lui R se pot considera alte ecuaţii "de tip Cauchy" ca f ( x + y ) = f ( x) f ( y ) , f ( xy ) = f ( x) + f ( y ) sau f ( xy ) = f ( x) f ( y ) , care prin substituţii adecvate se pot reduce la ecuaţia lui Cauchy. Rezolvarea unor astfel de ecuaţii, în ipoteze mai tari, ca de exemplu derivabilitatea devine foarte uşoară. În ecuaţia lui Cauchy, derivăm în raport cu y şi obţinem: f ' ( x + y ) = f ' ( y ), x, y ∈ R Dacă facem y = 0 rezultă f ' ( x) = f ' (0) = c şi f ( x) = cx + d , x ∈ R . Întorcându-ne în ecuaţie obţinem d = 0 , deci soluţiile derivabile sunt f ( x) = cx , x ∈ R unde c ∈ R este o constantă arbitrară.
13.2. Ecuaţia lui Jensen Interesul pentru ecuaţia funcţională a lui Jensen, parvine din studiul funcţiilor convexe, des folosite în teoria aproximării, funcţii definite prin inecuaţia lui Jensen. Fie I ⊂ R un interval (mulţime convexă). Definiţia 13.2.1. Ecuaţia funcţională f :I →R x + y J : f ( x ) + f ( y ) , x, y ∈ I f = 2 2 se numeşte ecuaţia lui Jensen (pe intervalul I). Observaţia 13.2.2. O funcţie f : I → R care verifică inecuaţia lui 1 x + y f ( x) + f ( y ) convexă, J se numeşte convexă (mai precis Jensen: f = 2 2 2 convexă sau Q convexă). Pentru resolvarea ecuaţiei J sunt utile următoarele observaţii: Observaţia 13.2.3. (a) Dacă f este soluţie a ecuaţiei J atunci pentru orice c ∈ R , funcţia f + c este de asemenea soluţie a ecuaţiei J, deci este suficient să căutăm doar soluţiile care într-un punct dat iau o valoare dată. (b) Dacă x0 ∈ I verifică ecuaţia J pe I atunci funcţia g : I1 → R , g ( x) = f ( x + x0 ) , x ∈ I1 , verifică ecuaţia lui Jensen pe intervalul
304
I1 = I − x0 = {x − x0 | x ∈ I } . De aici rezultă că este suficient să rezolvăm ecuaţia lui Jensen pe intervale care conţin originea. (c) Dacă 0 ∈ I şi notăm cu J 0 = { f 0 : I → R | f verifică J şi f 0 (0) = 0} atunci mulţimea soluţiilor ecuaţiei Jensen este J = { f 0 + c | f 0 ∈ J 0 , c ∈ R} . Dacă 0 ∈ I şi f 0 ∈ J atunci pentru orice x ∈ I şi n ∈ N avem egalitatea: x f ( x) f0 n = 0 n . 2 2 x f ( x) şi prin inducţie (Dacă în ecuaţia J punem y = 0 rezultă f 0 = 0 2 2 x x f ( x) înlocuind pe x cu n obţinem: f 0 n+1 = 0 n+1 ). 2 2 2 (e) Funcţia f : I → R este soluţie a ecuaţiei J pe intervalul I, dacă şi numai dacă funcţia f 0 : I1 → R f 0 ( x) = f ( x + x0 ) − f ( x0 ), x ∈ I1 este soluţie a ecuaţiei Jensen pe intervalul I1 = I − x0 şi verifică relaţia f 0 (0) = 0 . (f) Orice funcţie aditivă verifică ecuaţia lui Jensen pe orice interval y f ( x) f ( y ) f ( x) + f ( y ) x x y + = deci ( f + = f + f = 2 2 2 2 2 2 2 x + y f ( x) + f ( y ) ). f = 2 2 (g) Orice funcţie de forma f ( x) = g ( x) + c , x ∈ I cu c ∈ R o constantă arbitrară, verifică ecuaţia lui Jensen. Vom vedea în continuare că singurele funcţii care verifică ecuaţia J sunt cele de la (g). Teorema 13.2.4. Dacă funcţia f 0 : (− a, a) → R verifică ecuaţia lui Jensen şi f 0 (0) = 0 , atunci există o unică funcţie aditivă f1 : R → R astfel ca restricţia f1 |( − a ,a ) = f 0 . x f ( x) Demonstraţie. Din observaţia 1.4.2 (d), avem: f 0 = 0 şi f 0 2 2 fiind soluţie a ecuaţiei J
305
x + y f 0 ( x) + f 0 ( y ) , deci f 0 ( x + y ) = f 0 ( x) + f 0 ( y ) , adică funcţia f 0 f0 = 2 2 este aditivă pe intervalul (− a, a) . Dacă f1 este aditivă atunci f (2 n x) = 2 n f ( x) pentru orice n ∈ N şi orice x ∈ R . Luăm intervalele Dn = (−2 n a,2 n a ) , n ∈ N şi prelungim f 0 de la (− a, a) la Dn prin relaţia f1 (2 n x) = 2 n f 0 ( x) , unicul mod de prelungire ca f1 să fie aditivă. Cum
UD
n
= R , rezultă că obţinem funcţia f1 ca unica funcţie
n∈N
aditivă a cărei restricţie la (− a, a) este funcţia f 0 . Folosind teorema 1.4.1 şi observaţia 1.4.2(e) obţinem: Teorema 13.2.5. Funcţia f : [a, b] → R verifică ecuaţia x + y f ( x) + f ( y ) , f = 2 2 pentru orice x, y ∈ [a, b] , dacă şi numai dacă există o funcţie aditivă g : R → R şi o constantă reală c ∈ R astfel ca: f ( x ) = g ( x ) + c, x ∈ [ a , b ] Corolarul 13.2.6. Funcţia f : R → R verifică ecuaţia lui Jensen x + y f ( x) + f ( y ) , x, y ∈ R f = 2 2 dacă şi numai dacă funcţia g : R → R , g ( x) = f ( x) − f (0) , x ∈ R , verifică ecuaţia lui Cauchy g ( x + y ) = g ( x) + g ( y ), x, y ∈ R Corolarul 13.2.7. Singurele funcţii continue (monotone, local mărginite) f : (a, b) → R care verifică ecuaţia x + y f ( x) + f ( y ) f , x, y ∈ ( a , b ) = 2 2 sunt funcţiile polinomiale f ( x) = cx + d , x ∈ (a, b) unde c şi d sunt constante reale arbitrare.
13.3. Ecuaţia lui D'Alembert Ecuaţia funcţională f :R → R A: f ( x + y ) + f ( x − y ) = 2 f ( x) f ( y ), 306
x, y ∈ R
este cunoscută sub numele de ecuaţia cosinusului sau ecuaţia lui D'Alembert. Rezolvarea ei fără restricţii este complicată şi nu ne vom ocupa de ea aici. Ne propunem să determinăm doar funcţiile continue care verifică ecuaţia (A). Dacă punem în ecuaţie y = 0 , rezultă 2 f ( x) = 2 f ( x) f (0) , din care, dacă f este neconstantă ( f ≠ 0 şi f ≠ 1 ), rezultă f (0) = 1 . Dacă punem x = 0 , rezultă f (− y ) = f ( y ) , y ∈ R , deci soluţiile sunt funcţii pare. Dacă punem x = ny , rezultă f ((n + 1) y ) = 2 f ( y ) f (ny ) − f ((n − 1) y ) (1) 2 Dacă în (1) punem x = y , rezultă f (2 x) + f (0) = 2( f ( x)) , în care dacă facem t = 2 x , obţinem: 2
t f (t ) + 1 , t ∈R (2) f = 2 2 (ecuaţia verificată de funcţiile cos şi ch). Deoarece f (0) = 1 , există un interval [−a, a] astfel ca f ( x) > 0 , pentru orice x ∈ [− a, a ] . În continuare diferenţiem două cazuri (inspirate de soluţiile cos şi ch). π Cazul 1. Dacă 0 < f (a) ≤ f (1) , atunci există c ∈ 0, astfel ca 2 f (a) = cos c . Din relaţia (2), prin inducţie se arată că: c a f n = cos n , x ∈ N . (3) 2 2 Din (3) folosind relaţia (1) se arată prin inducţie că: k k f n a = cos n c , pentru orice k , n ∈ N . 2 2 k Deoarece mulţimea M = n a | k ∈ N, n ∈ N este densă în [0, ∞] şi f 2 este continuă, rezultă: f ( x) = cos bx, x ∈ R . Cazul 2. Dacă f (a) > 1 , există c > 0 astfel ca f (a) = chc . La fel ca în cazul 1, se arată că singura soluţie continuă este f ( x) = chbx , x ∈ R , de unde c b= . a În concluzie obţinem
307
Teorema 13.3.1. Funcţiile continue ce verifică ecuaţia lui D'Alembert
sunt:
f = 0, f ( x) = cos bx, x ∈ R şi f ( x) = chbx, x ∈ R , unde b ∈ R este o constantă arbitrară. Observaţia 13.3.2. Determinarea soluţiilor în ipoteza că funcţiile f sunt de două ori derivabile este mult mai simplă. Derivăm în ecuaţie în raport cu x, respectiv cu y de două ori şi obţinem relaţiile: f ' ' ( x + y ) + f ' ' ( x − y ) = 2 f ' ' ( x) f ( y ) f ' ' ( x + y ) + f ' ' ( x − y ) = 2 f ( x) f ' ' ( y ) deci f ' ' ( x) f ( y ) = f ( x) f ' ' ( y ) şi obţinem f ' ' ( x) = af ( x) . Dacă a = −ω2 rezultă f ( x) = b cos ωx + c sin ωx . Dacă a = ω2 rezultă f ( x) = bchωx + cshωx . Impunând acestor funcţii condiţiile f (0) = 1 , f (− x) = f ( x) rezultă f ( x) = cos ωx sau f ( x) = chωx , x ∈ R .
13.4. Ecuaţia lui Pexider
În unele ecuaţii funcţionale, apar mai multe funcţii necunoscute, un tip de astfel de funcţii fiind ecuaţiile de tip Pexider. Definiţia 13.4.1. Dacă f : R → R , g : R → R şi h : R → R sunt funcţii atunci ecuaţia funcţională: ( P) : f ( x + y ) = g ( x) + h( y ), x, y ∈ R se numeşte ecuaţia lui Pexider cu funcţiile necunoscute f , g şi h. Teorema 13.4.2. Funcţiile f , g şi h verifică ecuaţia lui Pexider (P) dacă şi numai dacă există o funcţie aditivă f 0 : R → R şi constantele a, b ∈ R astfel ca: f = f 0 + a + b, g = f 0 + a, h = f 0 + b . Demonstraţie. Dacă f, g, h sunt de forma dată avem: f ( x + y ) = f 0 ( x + y ) + a + b = f 0 ( x) + f 0 ( y ) + a + b = = ( f 0 ( x ) + a ) + ( f 0 ( y ) + b) = g ( x ) + h( y ) . Reciproc. Dacă punem în (P) y = 0 rezultă: f ( x) = g ( x) + h(0) şi notând h(0) = b rezultă g ( x) = f ( x) − b . Dacă punem în (P) x = 0 rezultă f ( y ) = g (0) + h( y ) şi notând g (0) = a rezultă h( y ) = f ( y ) − g (0) . Înlocuind g şi h în (P) obţinem: 308
f ( x + y ) = f ( x ) − b + f ( y ) − a , x, y ∈ R . Dacă facem substituţia f ( x) = f 0 ( x) + a + b obţinem pentru noua funcţie f 0 ecuaţia: f 0 ( x + y ) = f 0 ( x) + f 0 ( y ), x, y ∈ R deci f 0 este funcţie aditivă şi atunci f ( x) = f 0 ( x) + a + b, g ( x) = f 0 ( x) + a, h( x) = f 0 ( x) + b pentru orice x ∈ R . Observaţia 13.4.3. Dacă funcţiile f, g, h verifică ecuaţia (P) şi una din ele este funcţie continuă, atunci toate cele trei funcţii sunt funcţii continue. Corolarul 13.4.4. Funcţiile continue f, g, h care verifică ecuaţia lui Pexider (P) sunt: f ( x) = cx + a + b, g ( x) = cx + a, h( x) = cx + b pentru orice x ∈ R , unde a, b, c sunt constante reale arbitrare.
Bibliografie
[1] J. Aczel, Lectures on functional equations and their applications, Academic Press, New York and London, 1966. [2] M. Kuczma, An introduction to the theory of functional equations and inequalities, Univ. Slaski, Warszawa. 1985. [3] V. Pop, Ecuaţii funcţionale, Ed. Mediamira, Cluj-Napoca, 2002.
309
Probleme rezolvate R13.5.1. Să se arate că dacă f : R → R este o funcţie aditivă şi neinjectivă, atunci pentru orice x ∈ R mulţimea f −1 ({ f ( x)}) este densă în R. Soluţie. Deoarece f nu este injectivă, există x1 , x2 ∈ R , x1 ≠ x2 astfel ca f ( x1 ) = f ( x2 ) ⇔ f ( x1 ) − f ( x2 ) = 0 ⇔ f ( x1 − x2 ) ≠ 0 . Notând x0 = x1 − x2 ≠ 0 avem f ( x0 ) = 0 şi f (qx0 ) = 0 , q ∈ Q . Mulţimea {x + qx0 | q ∈ Q} = A este densă în R (pentru orice x ∈ R ) şi f ( x + qx0 ) = f ( x) + qf ( x0 ) = f ( x) , deci A ⊂ f −1 ({ f ( x)}) . R13.5.2. Să se arate că dacă f : R → R este o funcţie aditivă surjectivă, atunci f este bijectivă sau f are proprietatea lui Darboux. Soluţie. Dacă f nu este bijectivă, din surjectivitate rezultă că f este neinjectivă. Din problema 1.1.1, rezultă că pentru orice y ∈ R mulţimea f −1 ({ y}) este densă în R. Dacă y este între f (a ) şi f (b) , mulţimea f −1 ({ y}) fiind densă, are elemente între a şi b. Dacă x ∈ (a, b) ∩ f −1 ({ y}) atunci x ∈ ( a, b) şi f ( x) = y . R13.5.3. Fie f : R → R o funcţie aditivă, neinjectivă. Să se arate că pentru orice a ∈ R mulţimea N a = {x ∈ R | f ( x) = f (a)} este densă în R. Soluţie. Deoarece f este neinjectivă, există x1 ≠ x2 astfel ca f ( x1 ) = f ( x2 ) ⇔ f ( x1 − x2 ) = 0 . Dacă notăm x0 = x1 − x2 ≠ 0 , atunci mulţimea {a + qx0 | q ∈ Q} = A este densă în R şi f (a + qx0 ) = f (a ) + qf ( x0 ) = f (a ) adică A ⊂ N a , deci N a este densă în R. R13.5.4. Fie f : R → R o funcţie aditivă cu proprietatea că există x0 , y0 ∈ R astfel ca x0 f ( y0 ) ≠ y0 f ( x0 ) . Să se arate că oricare ar fi numerele reale a < b şi A < B mulţimile f ([ a, b]) şi f −1 ([ A, B]) sunt dense în R. Soluţie. Funcţia g : R → R , g ( x ) = f ( x ) − xf (1) este aditivă şi x0 g ( y 0 ) ≠ y 0 g ( x0 ) , deci g ( x0 ) ≠ 0 sau g ( y0 ) ≠ 0 .
Să presupunem că g ( x0 ) ≠ 0 ( x0 ≠ 0) şi evident g ( q ) = 0 , q ∈ Q . Mulţimile {qg ( x0 )q ∈ Q} şi {q '+ qx0 | q '∈ Q} sunt dense în R, deci oricare ar fi intervalele [c, d ] ⊂ R şi [ a, b] ⊂ R , există q ∈ Q astfel ca qg ( x0 ) ∈ [c, d ] şi există q '∈ Q astfel ca q'+ qx0 ∈ [a, b] . Avem:
310
g (q'+ qx0 ) = g (q ' ) + qg ( x0 ) = qg ( x0 ) ∈ [c, d ] deci mulţimea f ([ a, b]) este densă în R. Deoarece f ([ a, b]) este densă în R, avem f ([ a, b]) ∩ [ A, B ] ≠ ∅ ⇔ −1 f ([ A, B]) ∩ [a, b] ≠ 0 , cum intervalul [a, b] este arbitrar, rezultă că f −1 ([ A, B]) este densă. R13.5.5. Să se determine funcţiile continue f : R → ( −1,1) care verifică ecuaţia funcţională f ( x) + f ( y ) f ( x + y) = , 1 + f ( x) f ( y ) pentru orice x, y ∈ R . Soluţie. Considerăm funcţia g : R → R care verifică relaţia f ( x ) = thg ( x ) ( g ( x ) = arcthf ( x )), x ∈ R e y − e− y unde thy = y , th : R → (−1,1) fiind funcţie bijectivă cu inversa e + e−y arcth : ( −1,1) ∈ R . Funcţia g satisface ecuaţia: thg ( x) + thg ( y ) thg ( x + y ) = = th ( g ( x) + g ( y )) 1 + thg ( x) thg ( y ) deci g ( x + y ) = g ( x ) + g ( y ) , x, y ∈ R . Deoarece f este continuă şi th este continuă, rezultă că funcţia g este continuă şi aditivă, deci există a ∈ R astfel ca g ( x ) ax , x ∈ R ⇒ f ( x ) = thax , x∈R . R13.5.6. Să se determine funcţiile continue f : R → R care verifică ecuaţia funcţională f ( x + y ) = f ( x ) f ( y ), x, y ∈ R . Soluţie. Dacă există x0 ∈ R astfel ca f ( x0 ) = 0 atunci f ( x) = f ( x − x0 ) f ( x0 ) = 0 deci f = 0 . Dacă f ( x ) ≠ 0 , pentru orice x ∈ R atunci f (2 x) = ( f ( x)) 2 > 0 , deci f : R → (0, ∞ ) . Putem face substituţia f ( x) = e g ( x ) , g : R → R . Funcţia g verifică relaţia e g ( x + y ) = e g ( x ) ⋅ e g ( y ) = e g ( x )+ g ( y ) , deci g ( x + y ) = g ( x) + g ( y ), x, y ∈ R . Funcţia g este aditivă şi continuă, deci există c ∈ R astfel ca g ( x ) = cx , x∈R . Rezultă că soluţiile sunt f = 0 sau f ( x) = cx , x ∈ R sau f ( x) = a x , x ∈ R unde a > 0 este o constantă arbitrară. 311
R13.5.7. Să se determine funcţiile continue f : (0, ∞ ) → R care verifică ecuaţia funcţională f ( xy ) = f ( x ) f ( y ), x, y ∈ (0, ∞ ) . Soluţie. Dacă există y 0 cu f ( y 0 ) = 0 atunci f ( xy0 ) = 0 , x ∈ (0, ∞ ) , deci f = 0 . Dacă f ( x ) ≠ 0 , pentru orice x ∈ (0, ∞ ) atunci f ( x 2 ) = ( f ( x)) 2 > 0 deci f : (0, ∞ ) → (0, ∞ ) . Făcând schimbările de variabile x = e u , y = e v şi de funcţie g (u ) = f (e u ) , g : R → (0, ∞ ) , obţinem pentru g ecuaţia g (u + v ) = g (u ) g (v ) , u , v ∈ R . Cum g (u ) > 0 , pentru orice u, logaritmăm relaţia şi obţinem: ln g (u + v ) = ln g (u ) = ln g (v ), u , v ∈ R . Facem substituţia ln g = h şi obţinem h : R → R funcţie aditivă şi continuă, deci h(u ) = au , u ∈ R , g (u ) = e au , u ∈ R , g (u ) = (e u ) a , u ∈ R , f ( x) = x a , x ∈ (0, ∞ ) , unde a ∈ R este o constantă arbitrară. R13.5.8. Să se determine funcţiile continue f : R → R care verifică ecuaţia lui Gauss G : f ( x 2 + y 2 ) = f ( x ) f ( y ),
x, y ∈ R .
Soluţie. Pentru x = y = 0 rezultă f (0) = ( f (0)) 2 deci f (0) ∈ {0,1} . Dacă f (0) = 0 punem y = 0 şi obţinem f (| x |) = 0 , x ∈ R deci f ( x ) = 0 pentru orice x ≥ 0 . Punem în ecuaţie x = y = −t şi obţinem: f ( −t )) 2 = f ( 2 ⋅ | t |) = 0 deci f = 0 . Dacă f (0) = 1 şi punem în ecuaţie y = 1 , rezultă f (| x ) = f ( x) deci funcţia f este funcţie pară. E suficient să o determinăm pe (0, ∞ ) . Facem
substituţia de funcţie f ( x ) = g ( x) şi ecuaţia se scrie f ( x2 + y 2 ) = f ( x2 ) f ( y 2 ) ⇔ g(x2 + y 2 ) = g(x2 )g( y 2 ) ⇔ g (u + v ) = g (u ) g ( v ) , u , v > 0 . Dacă ar exista u > 0 cu g (u ) = 0 atunci g (u + v ) = g (u ) g (v) = 0 pentru orice v ≥ 0 , deci g (t ) = 0, pentru orice t ≥ u . 2
u u' u u Dar g (u ) = g 2 = g , deci g = 0 şi analog g n = 0 2 2 2 2 rezultă g (t ) = 0 , pentru orice t > 0 .
312
Rămâne de rezolvat cazul în care g (u ) ≠ 0 , pentru orice u > 0 şi cum g (2u ) = ( g (u )) 2 > 0 rezultă că funcţia g ia valori în (0, ∞ ) . Determinăm g : (0, ∞ ) → (0, ∞ ) cu proprietatea g (u + v ) = g (u ) g (v ) , u , v ∈ (0, ∞ ) care se reduce la ecuaţia lui Cauchy prin logaritmare ln g (u + v ) = ln g (u ) + ln g (v ) deci h(u + v ) = h(u ) + h(v ), u , v ∈ (0, ∞ ) unde h(u ) = ln g (u ) . Funcţia h fiind continuă rezultă că există a ∈ R astfel ca h( x ) = ax , x ∈ (0, ∞ ) . 2
Revenind la g şi f obţinem: g (u ) = e au , u > 0 şi f ( x) = e ax , x ∈ R , unde a ∈ R este o constantă arbitrară. Observaţie. Ecuaţia este atribuită lui Gauss şi este legată de teoria 2
probabilităţilor, funcţia de repartiţie Gauss fiind f ( x) = e − x , x ∈ R al cărui grafic este cunoscut sub numele de clopotul lui Gauss. R13.5.9. Să se determine funcţiile continue f : R → R care verifică ecuaţia funcţională f ( x + y ) + f ( x − y ) = 2[ f ( x) + f ( y )], x, y ∈ R . Soluţie. Punând x = y = 0 rezultă f (0) = 0 . Dacă punem rezultă f ( 2 x ) = 4 f ( x ) . Pentru x = ny rezultă: f (( n + 1) y ) + f (( n − 1) y ) = 2[ f ( ny ) + f ( y )] . Prin inducţie se demonstrează că f (ny ) = n 2 f ( y ) , n ∈ N deci z z z z 1 f n = n 2 f ⇔ f ( z ) = n 2 f deci f = 2 f ( z ) şi rezultă n n n n n 2 f (qy ) = q f ( y ), q ∈ Q ∩ (0, ∞) . Dacă punem în ecuaţie x = 0 rezultă f ( − y ) = f ( y ) , deci f (qy ) = q 2 f ( y ) , pentru orice q ∈ Q şi orice y ∈ R . Din ipoteza de continuitate rezultă f ( x) = ax 2 , x ∈ R unde a ∈ R este o constantă arbitrară. Observaţie. Ecuaţia dată se numeşte ecuaţia paralelogramului. Dacă Veste un spaţiu euclidian funcţia f ( x) =|| x || 2 verifică relaţia || x + y || 2 + || x − y || 2 = 2(|| x || 2 + || y || 2 ) . R13.5.10. Fie a ∈ R , a ≠ 1 şi b ∈ R . Să se determine funcţiile continue f : R → R care verifică relaţia f ( x ) = f ( ax + b) , x ∈ R .
313
Soluţie. Dacă a = −1 . f ( x ) = f (b − x ), x ∈ R . Pentru x
2 b unde h : − ∞, → R este o funcţie continuă arbitrară. 2 b 1 Dacă | a |≠ 1 ecuaţia se mai scrie sub forma f x − = f ( x) . a a 1 Unul din numerele a sau este de modul subunitar şi să presupunem că a | a |< 1 . Considerăm şirul definit prin relaţia de recurenţă: x0 = x ∈ R, xn+1 = axn + b, n ∈ R . b−x >
Din ecuaţie: f ( xn+1 ) = f ( xn ), n ∈ N deci f ( xn ) = f ( x), n ∈ N 1− an b , şirul ( xn ) fiind convergent şi lim xn = . n→∞ 1− a 1− a Dacă în relaţia f ( x) = f ( xn ), n ∈ N , trecem la limită după n → ∞ , Avem: xn = a n x + b
b ţinând cont că f este continuă, rezultă f ( x) = f = c, x ∈ R . 1− a Deci dacă a ≠ 1 şi a ≠ −1 , singurele funcţii continue care verifică ecuaţia dată sunt funcţiile constante. R13.5.11. Să se determine toate funcţiile f : R → R care au proprietăţile: a) f este continuă, b) f ( x + 1) = f ( x ) + 2 x + 1 , x ∈ R ,
c) f ( x + 2 ) = f ( x ) + 2 2 ⋅ x + 2 , x ∈ R . Soluţie. Căutăm funcţiile g : R → R definite prin substituţia f ( x) = x 2 + g ( x), x ∈ R . Funcţia g verifică condiţiile: 314
a1) g continuă b1) g ( x + 1) = g ( x ) c1 ) g ( x + 2 ) = g ( x ) . Din b1) şi c1) obţinem (inducţie) g ( x + m + n 2 ) = g ( x) pentru orice x ∈ R , m ∈ Z şi n ∈ Z . Mulţimea A = {m − n 2 | m ∈ Z, n ∈ Z} este densă în R, deci pentru orice x ∈ R , există un şir ( xn ) n∈N , xn ∈ A, n ∈ N cu lim xn = x . Din faptul că g este n→∞
continuă, rezultă g ( x) = lim g ( xn ) = lim g (0) = g (0), ( g (m + n 2 ) = g (0), m, n ∈ Z). n →∞
n →∞
Obţinem ca soluţii funcţiile f c : R → R, c ∈ R şi
315
f c ( x) = x 2 + c .
Bibliografie 1. Andreescu T., Andrica D., O introducere în studiul ecuaţiilor diofantiene, Editura Gil, 2002 2. Andrei Gh., Caragea C., Bordea Gh., Algebră pentru concursurile de admitere şi olimpiade şcolare, Constanţa, 1993 3. Buşneag Dumitru, Ioan Maftei, Teme pentru cercurile şi concursurile de matematică ale elevilor, Editura Scrisul Românesc, Craiova, 1983 4. Dan si Rodica Brânzei, Sebastian şi Alice Aniţa, Şiruri recurente în liceu, Editura Gil, Zalău, 1996 5. Ion D. Ion, Nicolae Angelescu, Meri Constantinescu, Algebră, clasa a XI-a, Editura Paralela 45, 1999 6. Mortici Cristinel, Probleme pregătitoare pentru concursurile de matematică, Editura Gil, Zalău, 1999 7. Năstasescu C., Stănescu I., Niţă C., Elemente de algebră superioară, Manual pentru clasa a XI-a, Editura Didactică si Pedagogică, Bucureşti, 1995 8. Pop Vasile, Corovei Ilie, Culegere de probleme de algebră, Universitatea Tehnică Cluj-N., 1995 9. Purdea I., Pic Gh, Tratat de algebră modernă, Vol I, Editura Academiei, Bucureşti, 1977. 10. Roger A. Horn, Charles R. Johnson, Analiză matematică – Texte Matematice Esenţiale, Editura Theta, Bucureşti, 2002 11. Colecţia „Gazeta Matematică” 12.Colecţia „Revista de matematică a elevilor din Timişoara”
130