lmfit/lib/lmmin.c

*5ddc57e5SXin Li/*
*5ddc57e5SXin Li * Library:   lmfit (Levenberg-Marquardt least squares fitting)
*5ddc57e5SXin Li *
*5ddc57e5SXin Li * File:      lmmin.c
*5ddc57e5SXin Li *
*5ddc57e5SXin Li * Contents:  Levenberg-Marquardt minimization.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li * Copyright: MINPACK authors, The University of Chikago (1980-1999)
*5ddc57e5SXin Li *            Joachim Wuttke, Forschungszentrum Juelich GmbH (2004-2013)
*5ddc57e5SXin Li *
*5ddc57e5SXin Li * License:   see ../COPYING (FreeBSD)
*5ddc57e5SXin Li *
*5ddc57e5SXin Li * Homepage:  apps.jcns.fz-juelich.de/lmfit
*5ddc57e5SXin Li */
*5ddc57e5SXin Li
*5ddc57e5SXin Li#include <assert.h>
*5ddc57e5SXin Li#include <stdlib.h>
*5ddc57e5SXin Li#include <stdio.h>
*5ddc57e5SXin Li#include <math.h>
*5ddc57e5SXin Li#include <float.h>
*5ddc57e5SXin Li#include "lmmin.h"
*5ddc57e5SXin Li
*5ddc57e5SXin Li#define MIN(a, b) (((a) <= (b)) ? (a) : (b))
*5ddc57e5SXin Li#define MAX(a, b) (((a) >= (b)) ? (a) : (b))
*5ddc57e5SXin Li#define SQR(x) (x) * (x)
*5ddc57e5SXin Li
*5ddc57e5SXin Li/* Declare functions that do the heavy numerics.
*5ddc57e5SXin Li   Implementions are in this source file, below lmmin.
*5ddc57e5SXin Li   Dependences: lmmin calls lmpar, which calls qrfac and qrsolv. */
*5ddc57e5SXin Livoid lm_lmpar(const int n, double* r, const int ldr, const int* Pivot,
*5ddc57e5SXin Li              const double* diag, const double* qtb, const double delta,
*5ddc57e5SXin Li              double* par, double* x, double* Sdiag, double* aux, double* xdi);
*5ddc57e5SXin Livoid lm_qrfac(const int m, const int n, double* A, int* Pivot, double* Rdiag,
*5ddc57e5SXin Li              double* Acnorm, double* W);
*5ddc57e5SXin Livoid lm_qrsolv(const int n, double* r, const int ldr, const int* Pivot,
*5ddc57e5SXin Li               const double* diag, const double* qtb, double* x,
*5ddc57e5SXin Li               double* Sdiag, double* W);
*5ddc57e5SXin Li
*5ddc57e5SXin Li/******************************************************************************/
*5ddc57e5SXin Li/*  Numeric constants                                                         */
*5ddc57e5SXin Li/******************************************************************************/
*5ddc57e5SXin Li
*5ddc57e5SXin Li/* Set machine-dependent constants to values from float.h. */
*5ddc57e5SXin Li#define LM_MACHEP DBL_EPSILON       /* resolution of arithmetic */
*5ddc57e5SXin Li#define LM_DWARF DBL_MIN            /* smallest nonzero number */
*5ddc57e5SXin Li#define LM_SQRT_DWARF sqrt(DBL_MIN) /* square should not underflow */
*5ddc57e5SXin Li#define LM_SQRT_GIANT sqrt(DBL_MAX) /* square should not overflow */
*5ddc57e5SXin Li#define LM_USERTOL 30 * LM_MACHEP   /* users are recommended to require this */
*5ddc57e5SXin Li
*5ddc57e5SXin Li/* If the above values do not work, the following seem good for an x86:
*5ddc57e5SXin Li LM_MACHEP     .555e-16
*5ddc57e5SXin Li LM_DWARF      9.9e-324
*5ddc57e5SXin Li LM_SQRT_DWARF 1.e-160
*5ddc57e5SXin Li LM_SQRT_GIANT 1.e150
*5ddc57e5SXin Li LM_USER_TOL   1.e-14
*5ddc57e5SXin Li   The following values should work on any machine:
*5ddc57e5SXin Li LM_MACHEP     1.2e-16
*5ddc57e5SXin Li LM_DWARF      1.0e-38
*5ddc57e5SXin Li LM_SQRT_DWARF 3.834e-20
*5ddc57e5SXin Li LM_SQRT_GIANT 1.304e19
*5ddc57e5SXin Li LM_USER_TOL   1.e-14
*5ddc57e5SXin Li*/
*5ddc57e5SXin Li
*5ddc57e5SXin Li/* Predefined control parameter sets (msgfile=NULL means stdout). */
*5ddc57e5SXin Liconst lm_control_struct lm_control_double = {
*5ddc57e5SXin Li    LM_USERTOL, LM_USERTOL, LM_USERTOL, LM_USERTOL,
*5ddc57e5SXin Li    100., 100, 1, NULL, 0, -1, -1};
*5ddc57e5SXin Liconst lm_control_struct lm_control_float = {
*5ddc57e5SXin Li    1.e-7, 1.e-7, 1.e-7, 1.e-7,
*5ddc57e5SXin Li    100., 100, 1, NULL, 0, -1, -1};
*5ddc57e5SXin Li
*5ddc57e5SXin Li/******************************************************************************/
*5ddc57e5SXin Li/*  Message texts (indexed by status.info)                                    */
*5ddc57e5SXin Li/******************************************************************************/
*5ddc57e5SXin Li
*5ddc57e5SXin Liconst char* lm_infmsg[] = {
*5ddc57e5SXin Li    "found zero (sum of squares below underflow limit)",
*5ddc57e5SXin Li    "converged  (the relative error in the sum of squares is at most tol)",
*5ddc57e5SXin Li    "converged  (the relative error of the parameter vector is at most tol)",
*5ddc57e5SXin Li    "converged  (both errors are at most tol)",
*5ddc57e5SXin Li    "trapped    (by degeneracy; increasing epsilon might help)",
*5ddc57e5SXin Li    "exhausted  (number of function calls exceeding preset patience)",
*5ddc57e5SXin Li    "failed     (ftol<tol: cannot reduce sum of squares any further)",
*5ddc57e5SXin Li    "failed     (xtol<tol: cannot improve approximate solution any further)",
*5ddc57e5SXin Li    "failed     (gtol<tol: cannot improve approximate solution any further)",
*5ddc57e5SXin Li    "crashed    (not enough memory)",
*5ddc57e5SXin Li    "exploded   (fatal coding error: improper input parameters)",
*5ddc57e5SXin Li    "stopped    (break requested within function evaluation)",
*5ddc57e5SXin Li    "found nan  (function value is not-a-number or infinite)"};
*5ddc57e5SXin Li
*5ddc57e5SXin Liconst char* lm_shortmsg[] = {
*5ddc57e5SXin Li    "found zero",
*5ddc57e5SXin Li    "converged (f)",
*5ddc57e5SXin Li    "converged (p)",
*5ddc57e5SXin Li    "converged (2)",
*5ddc57e5SXin Li    "degenerate",
*5ddc57e5SXin Li    "call limit",
*5ddc57e5SXin Li    "failed (f)",
*5ddc57e5SXin Li    "failed (p)",
*5ddc57e5SXin Li    "failed (o)",
*5ddc57e5SXin Li    "no memory",
*5ddc57e5SXin Li    "invalid input",
*5ddc57e5SXin Li    "user break",
*5ddc57e5SXin Li    "found nan"};
*5ddc57e5SXin Li
*5ddc57e5SXin Li/******************************************************************************/
*5ddc57e5SXin Li/*  Monitoring auxiliaries.                                                   */
*5ddc57e5SXin Li/******************************************************************************/
*5ddc57e5SXin Li
*5ddc57e5SXin Livoid lm_print_pars(int nout, const double* par, FILE* fout)
*5ddc57e5SXin Li{
*5ddc57e5SXin Li    int i;
*5ddc57e5SXin Li    for (i = 0; i < nout; ++i)
*5ddc57e5SXin Li        fprintf(fout, " %16.9g", par[i]);
*5ddc57e5SXin Li    fprintf(fout, "\n");
*5ddc57e5SXin Li}
*5ddc57e5SXin Li
*5ddc57e5SXin Li/******************************************************************************/
*5ddc57e5SXin Li/*  lmmin (main minimization routine)                                         */
*5ddc57e5SXin Li/******************************************************************************/
*5ddc57e5SXin Li
*5ddc57e5SXin Livoid lmmin(const int n, double* x, const int m, const void* data,
*5ddc57e5SXin Li           void (*evaluate)(const double* par, const int m_dat,
*5ddc57e5SXin Li                            const void* data, double* fvec, int* userbreak),
*5ddc57e5SXin Li           const lm_control_struct* C, lm_status_struct* S)
*5ddc57e5SXin Li{
*5ddc57e5SXin Li    int j, i;
*5ddc57e5SXin Li    double actred, dirder, fnorm, fnorm1, gnorm, pnorm, prered, ratio, step,
*5ddc57e5SXin Li        sum, temp, temp1, temp2, temp3;
*5ddc57e5SXin Li
*5ddc57e5SXin Li    /***  Initialize internal variables.  ***/
*5ddc57e5SXin Li
*5ddc57e5SXin Li    int maxfev = C->patience * (n+1);
*5ddc57e5SXin Li
*5ddc57e5SXin Li    int inner_success; /* flag for loop control */
*5ddc57e5SXin Li    double lmpar = 0;  /* Levenberg-Marquardt parameter */
*5ddc57e5SXin Li    double delta = 0;
*5ddc57e5SXin Li    double xnorm = 0;
*5ddc57e5SXin Li    double eps = sqrt(MAX(C->epsilon, LM_MACHEP)); /* for forward differences */
*5ddc57e5SXin Li
*5ddc57e5SXin Li    int nout = C->n_maxpri == -1 ? n : MIN(C->n_maxpri, n);
*5ddc57e5SXin Li
*5ddc57e5SXin Li    /* Reinterpret C->msgfile=NULL as stdout (which is unavailable for
*5ddc57e5SXin Li       compile-time initialization of lm_control_double and similar). */
*5ddc57e5SXin Li    FILE* msgfile = C->msgfile ? C->msgfile : stdout;
*5ddc57e5SXin Li
*5ddc57e5SXin Li    /***  Default status info; must be set before first return statement.  ***/
*5ddc57e5SXin Li
*5ddc57e5SXin Li    S->outcome = 0; /* status code */
*5ddc57e5SXin Li    S->userbreak = 0;
*5ddc57e5SXin Li    S->nfev = 0; /* function evaluation counter */
*5ddc57e5SXin Li
*5ddc57e5SXin Li    /***  Check input parameters for errors.  ***/
*5ddc57e5SXin Li
*5ddc57e5SXin Li    if (n <= 0) {
*5ddc57e5SXin Li        fprintf(stderr, "lmmin: invalid number of parameters %i\n", n);
*5ddc57e5SXin Li        S->outcome = 10;
*5ddc57e5SXin Li        return;
*5ddc57e5SXin Li    }
*5ddc57e5SXin Li    if (m < n) {
*5ddc57e5SXin Li        fprintf(stderr, "lmmin: number of data points (%i) "
*5ddc57e5SXin Li                        "smaller than number of parameters (%i)\n",
*5ddc57e5SXin Li                m, n);
*5ddc57e5SXin Li        S->outcome = 10;
*5ddc57e5SXin Li        return;
*5ddc57e5SXin Li    }
*5ddc57e5SXin Li    if (C->ftol < 0 || C->xtol < 0 || C->gtol < 0) {
*5ddc57e5SXin Li        fprintf(stderr,
*5ddc57e5SXin Li                "lmmin: negative tolerance (at least one of %g %g %g)\n",
*5ddc57e5SXin Li                C->ftol, C->xtol, C->gtol);
*5ddc57e5SXin Li        S->outcome = 10;
*5ddc57e5SXin Li        return;
*5ddc57e5SXin Li    }
*5ddc57e5SXin Li    if (maxfev <= 0) {
*5ddc57e5SXin Li        fprintf(stderr, "lmmin: nonpositive function evaluations limit %i\n",
*5ddc57e5SXin Li                maxfev);
*5ddc57e5SXin Li        S->outcome = 10;
*5ddc57e5SXin Li        return;
*5ddc57e5SXin Li    }
*5ddc57e5SXin Li    if (C->stepbound <= 0) {
*5ddc57e5SXin Li        fprintf(stderr, "lmmin: nonpositive stepbound %g\n", C->stepbound);
*5ddc57e5SXin Li        S->outcome = 10;
*5ddc57e5SXin Li        return;
*5ddc57e5SXin Li    }
*5ddc57e5SXin Li    if (C->scale_diag != 0 && C->scale_diag != 1) {
*5ddc57e5SXin Li        fprintf(stderr, "lmmin: logical variable scale_diag=%i, "
*5ddc57e5SXin Li                        "should be 0 or 1\n",
*5ddc57e5SXin Li                C->scale_diag);
*5ddc57e5SXin Li        S->outcome = 10;
*5ddc57e5SXin Li        return;
*5ddc57e5SXin Li    }
*5ddc57e5SXin Li
*5ddc57e5SXin Li    /***  Allocate work space.  ***/
*5ddc57e5SXin Li
*5ddc57e5SXin Li    /* Allocate total workspace with just one system call */
*5ddc57e5SXin Li    char* ws;
*5ddc57e5SXin Li    if ((ws = malloc((2*m + 5*n + m*n) * sizeof(double) +
*5ddc57e5SXin Li                     n * sizeof(int))) == NULL) {
*5ddc57e5SXin Li        S->outcome = 9;
*5ddc57e5SXin Li        return;
*5ddc57e5SXin Li    }
*5ddc57e5SXin Li
*5ddc57e5SXin Li    /* Assign workspace segments. */
*5ddc57e5SXin Li    char* pws = ws;
*5ddc57e5SXin Li    double* fvec = (double*)pws;
*5ddc57e5SXin Li    pws += m * sizeof(double) / sizeof(char);
*5ddc57e5SXin Li    double* diag = (double*)pws;
*5ddc57e5SXin Li    pws += n * sizeof(double) / sizeof(char);
*5ddc57e5SXin Li    double* qtf = (double*)pws;
*5ddc57e5SXin Li    pws += n * sizeof(double) / sizeof(char);
*5ddc57e5SXin Li    double* fjac = (double*)pws;
*5ddc57e5SXin Li    pws += n * m * sizeof(double) / sizeof(char);
*5ddc57e5SXin Li    double* wa1 = (double*)pws;
*5ddc57e5SXin Li    pws += n * sizeof(double) / sizeof(char);
*5ddc57e5SXin Li    double* wa2 = (double*)pws;
*5ddc57e5SXin Li    pws += n * sizeof(double) / sizeof(char);
*5ddc57e5SXin Li    double* wa3 = (double*)pws;
*5ddc57e5SXin Li    pws += n * sizeof(double) / sizeof(char);
*5ddc57e5SXin Li    double* wf = (double*)pws;
*5ddc57e5SXin Li    pws += m * sizeof(double) / sizeof(char);
*5ddc57e5SXin Li    int* Pivot = (int*)pws;
*5ddc57e5SXin Li    pws += n * sizeof(int) / sizeof(char);
*5ddc57e5SXin Li
*5ddc57e5SXin Li    /* Initialize diag. */
*5ddc57e5SXin Li    if (!C->scale_diag)
*5ddc57e5SXin Li        for (j = 0; j < n; j++)
*5ddc57e5SXin Li            diag[j] = 1;
*5ddc57e5SXin Li
*5ddc57e5SXin Li    /***  Evaluate function at starting point and calculate norm.  ***/
*5ddc57e5SXin Li
*5ddc57e5SXin Li    if (C->verbosity) {
*5ddc57e5SXin Li        fprintf(msgfile, "lmmin start ");
*5ddc57e5SXin Li        lm_print_pars(nout, x, msgfile);
*5ddc57e5SXin Li    }
*5ddc57e5SXin Li    (*evaluate)(x, m, data, fvec, &(S->userbreak));
*5ddc57e5SXin Li    if (C->verbosity > 4)
*5ddc57e5SXin Li        for (i = 0; i < m; ++i)
*5ddc57e5SXin Li            fprintf(msgfile, "    fvec[%4i] = %18.8g\n", i, fvec[i]);
*5ddc57e5SXin Li    S->nfev = 1;
*5ddc57e5SXin Li    if (S->userbreak)
*5ddc57e5SXin Li        goto terminate;
*5ddc57e5SXin Li    fnorm = lm_enorm(m, fvec);
*5ddc57e5SXin Li    if (C->verbosity)
*5ddc57e5SXin Li        fprintf(msgfile, "  fnorm = %18.8g\n", fnorm);
*5ddc57e5SXin Li
*5ddc57e5SXin Li    if (!isfinite(fnorm)) {
*5ddc57e5SXin Li        S->outcome = 12; /* nan */
*5ddc57e5SXin Li        goto terminate;
*5ddc57e5SXin Li    } else if (fnorm <= LM_DWARF) {
*5ddc57e5SXin Li        S->outcome = 0; /* sum of squares almost zero, nothing to do */
*5ddc57e5SXin Li        goto terminate;
*5ddc57e5SXin Li    }
*5ddc57e5SXin Li
*5ddc57e5SXin Li    /***  The outer loop: compute gradient, then descend.  ***/
*5ddc57e5SXin Li
*5ddc57e5SXin Li    for (int outer = 0;; ++outer) {
*5ddc57e5SXin Li
*5ddc57e5SXin Li        /** Calculate the Jacobian. **/
*5ddc57e5SXin Li        for (j = 0; j < n; j++) {
*5ddc57e5SXin Li            temp = x[j];
*5ddc57e5SXin Li            step = MAX(eps * eps, eps * fabs(temp));
*5ddc57e5SXin Li            x[j] += step; /* replace temporarily */
*5ddc57e5SXin Li            (*evaluate)(x, m, data, wf, &(S->userbreak));
*5ddc57e5SXin Li            ++(S->nfev);
*5ddc57e5SXin Li            if (S->userbreak)
*5ddc57e5SXin Li                goto terminate;
*5ddc57e5SXin Li            for (i = 0; i < m; i++)
*5ddc57e5SXin Li                fjac[j*m+i] = (wf[i] - fvec[i]) / step;
*5ddc57e5SXin Li            x[j] = temp; /* restore */
*5ddc57e5SXin Li        }
*5ddc57e5SXin Li        if (C->verbosity >= 10) {
*5ddc57e5SXin Li            /* print the entire matrix */
*5ddc57e5SXin Li            printf("\nlmmin Jacobian\n");
*5ddc57e5SXin Li            for (i = 0; i < m; i++) {
*5ddc57e5SXin Li                printf("  ");
*5ddc57e5SXin Li                for (j = 0; j < n; j++)
*5ddc57e5SXin Li                    printf("%.5e ", fjac[j*m+i]);
*5ddc57e5SXin Li                printf("\n");
*5ddc57e5SXin Li            }
*5ddc57e5SXin Li        }
*5ddc57e5SXin Li
*5ddc57e5SXin Li        /** Compute the QR factorization of the Jacobian. **/
*5ddc57e5SXin Li
*5ddc57e5SXin Li        /* fjac is an m by n array. The upper n by n submatrix of fjac is made
*5ddc57e5SXin Li         *   to contain an upper triangular matrix R with diagonal elements of
*5ddc57e5SXin Li         *   nonincreasing magnitude such that
*5ddc57e5SXin Li         *
*5ddc57e5SXin Li         *         P^T*(J^T*J)*P = R^T*R
*5ddc57e5SXin Li         *
*5ddc57e5SXin Li         *         (NOTE: ^T stands for matrix transposition),
*5ddc57e5SXin Li         *
*5ddc57e5SXin Li         *   where P is a permutation matrix and J is the final calculated
*5ddc57e5SXin Li         *   Jacobian. Column j of P is column Pivot(j) of the identity matrix.
*5ddc57e5SXin Li         *   The lower trapezoidal part of fjac contains information generated
*5ddc57e5SXin Li         *   during the computation of R.
*5ddc57e5SXin Li         *
*5ddc57e5SXin Li         * Pivot is an integer array of length n. It defines a permutation
*5ddc57e5SXin Li         *   matrix P such that jac*P = Q*R, where jac is the final calculated
*5ddc57e5SXin Li         *   Jacobian, Q is orthogonal (not stored), and R is upper triangular
*5ddc57e5SXin Li         *   with diagonal elements of nonincreasing magnitude. Column j of P
*5ddc57e5SXin Li         *   is column Pivot(j) of the identity matrix.
*5ddc57e5SXin Li         */
*5ddc57e5SXin Li
*5ddc57e5SXin Li        lm_qrfac(m, n, fjac, Pivot, wa1, wa2, wa3);
*5ddc57e5SXin Li        /* return values are Pivot, wa1=rdiag, wa2=acnorm */
*5ddc57e5SXin Li
*5ddc57e5SXin Li        /** Form Q^T * fvec, and store first n components in qtf. **/
*5ddc57e5SXin Li        for (i = 0; i < m; i++)
*5ddc57e5SXin Li            wf[i] = fvec[i];
*5ddc57e5SXin Li
*5ddc57e5SXin Li        for (j = 0; j < n; j++) {
*5ddc57e5SXin Li            temp3 = fjac[j*m+j];
*5ddc57e5SXin Li            if (temp3 != 0) {
*5ddc57e5SXin Li                sum = 0;
*5ddc57e5SXin Li                for (i = j; i < m; i++)
*5ddc57e5SXin Li                    sum += fjac[j*m+i] * wf[i];
*5ddc57e5SXin Li                temp = -sum / temp3;
*5ddc57e5SXin Li                for (i = j; i < m; i++)
*5ddc57e5SXin Li                    wf[i] += fjac[j*m+i] * temp;
*5ddc57e5SXin Li            }
*5ddc57e5SXin Li            fjac[j*m+j] = wa1[j];
*5ddc57e5SXin Li            qtf[j] = wf[j];
*5ddc57e5SXin Li        }
*5ddc57e5SXin Li
*5ddc57e5SXin Li        /**  Compute norm of scaled gradient and detect degeneracy. **/
*5ddc57e5SXin Li        gnorm = 0;
*5ddc57e5SXin Li        for (j = 0; j < n; j++) {
*5ddc57e5SXin Li            if (wa2[Pivot[j]] == 0)
*5ddc57e5SXin Li                continue;
*5ddc57e5SXin Li            sum = 0;
*5ddc57e5SXin Li            for (i = 0; i <= j; i++)
*5ddc57e5SXin Li                sum += fjac[j*m+i] * qtf[i];
*5ddc57e5SXin Li            gnorm = MAX(gnorm, fabs(sum / wa2[Pivot[j]] / fnorm));
*5ddc57e5SXin Li        }
*5ddc57e5SXin Li
*5ddc57e5SXin Li        if (gnorm <= C->gtol) {
*5ddc57e5SXin Li            S->outcome = 4;
*5ddc57e5SXin Li            goto terminate;
*5ddc57e5SXin Li        }
*5ddc57e5SXin Li
*5ddc57e5SXin Li        /** Initialize or update diag and delta. **/
*5ddc57e5SXin Li        if (!outer) { /* first iteration only */
*5ddc57e5SXin Li            if (C->scale_diag) {
*5ddc57e5SXin Li                /* diag := norms of the columns of the initial Jacobian */
*5ddc57e5SXin Li                for (j = 0; j < n; j++)
*5ddc57e5SXin Li                    diag[j] = wa2[j] ? wa2[j] : 1;
*5ddc57e5SXin Li                /* xnorm := || D x || */
*5ddc57e5SXin Li                for (j = 0; j < n; j++)
*5ddc57e5SXin Li                    wa3[j] = diag[j] * x[j];
*5ddc57e5SXin Li                xnorm = lm_enorm(n, wa3);
*5ddc57e5SXin Li                if (C->verbosity >= 2) {
*5ddc57e5SXin Li                    fprintf(msgfile, "lmmin diag  ");
*5ddc57e5SXin Li                    lm_print_pars(nout, x, msgfile); // xnorm
*5ddc57e5SXin Li                    fprintf(msgfile, "  xnorm = %18.8g\n", xnorm);
*5ddc57e5SXin Li                }
*5ddc57e5SXin Li                /* Only now print the header for the loop table. */
*5ddc57e5SXin Li                if (C->verbosity >= 3) {
*5ddc57e5SXin Li                    fprintf(msgfile, "  o  i     lmpar    prered"
*5ddc57e5SXin Li                                     "          ratio    dirder      delta"
*5ddc57e5SXin Li                                     "      pnorm                 fnorm");
*5ddc57e5SXin Li                    for (i = 0; i < nout; ++i)
*5ddc57e5SXin Li                        fprintf(msgfile, "               p%i", i);
*5ddc57e5SXin Li                    fprintf(msgfile, "\n");
*5ddc57e5SXin Li                }
*5ddc57e5SXin Li            } else {
*5ddc57e5SXin Li                xnorm = lm_enorm(n, x);
*5ddc57e5SXin Li            }
*5ddc57e5SXin Li            if (!isfinite(xnorm)) {
*5ddc57e5SXin Li                S->outcome = 12; /* nan */
*5ddc57e5SXin Li                goto terminate;
*5ddc57e5SXin Li            }
*5ddc57e5SXin Li            /* Initialize the step bound delta. */
*5ddc57e5SXin Li            if (xnorm)
*5ddc57e5SXin Li                delta = C->stepbound * xnorm;
*5ddc57e5SXin Li            else
*5ddc57e5SXin Li                delta = C->stepbound;
*5ddc57e5SXin Li        } else {
*5ddc57e5SXin Li            if (C->scale_diag) {
*5ddc57e5SXin Li                for (j = 0; j < n; j++)
*5ddc57e5SXin Li                    diag[j] = MAX(diag[j], wa2[j]);
*5ddc57e5SXin Li            }
*5ddc57e5SXin Li        }
*5ddc57e5SXin Li
*5ddc57e5SXin Li        /** The inner loop. **/
*5ddc57e5SXin Li        int inner = 0;
*5ddc57e5SXin Li        do {
*5ddc57e5SXin Li
*5ddc57e5SXin Li            /** Determine the Levenberg-Marquardt parameter. **/
*5ddc57e5SXin Li            lm_lmpar(n, fjac, m, Pivot, diag, qtf, delta, &lmpar,
*5ddc57e5SXin Li                     wa1, wa2, wf, wa3);
*5ddc57e5SXin Li            /* used return values are fjac (partly), lmpar, wa1=x, wa3=diag*x */
*5ddc57e5SXin Li
*5ddc57e5SXin Li            /* Predict scaled reduction. */
*5ddc57e5SXin Li            pnorm = lm_enorm(n, wa3);
*5ddc57e5SXin Li            if (!isfinite(pnorm)) {
*5ddc57e5SXin Li                S->outcome = 12; /* nan */
*5ddc57e5SXin Li                goto terminate;
*5ddc57e5SXin Li            }
*5ddc57e5SXin Li            temp2 = lmpar * SQR(pnorm / fnorm);
*5ddc57e5SXin Li            for (j = 0; j < n; j++) {
*5ddc57e5SXin Li                wa3[j] = 0;
*5ddc57e5SXin Li                for (i = 0; i <= j; i++)
*5ddc57e5SXin Li                    wa3[i] -= fjac[j*m+i] * wa1[Pivot[j]];
*5ddc57e5SXin Li            }
*5ddc57e5SXin Li            temp1 = SQR(lm_enorm(n, wa3) / fnorm);
*5ddc57e5SXin Li            if (!isfinite(temp1)) {
*5ddc57e5SXin Li                S->outcome = 12; /* nan */
*5ddc57e5SXin Li                goto terminate;
*5ddc57e5SXin Li            }
*5ddc57e5SXin Li            prered = temp1 + 2*temp2;
*5ddc57e5SXin Li            dirder = -temp1 + temp2; /* scaled directional derivative */
*5ddc57e5SXin Li
*5ddc57e5SXin Li            /* At first call, adjust the initial step bound. */
*5ddc57e5SXin Li            if (!outer && pnorm < delta)
*5ddc57e5SXin Li                delta = pnorm;
*5ddc57e5SXin Li
*5ddc57e5SXin Li            /** Evaluate the function at x + p. **/
*5ddc57e5SXin Li            for (j = 0; j < n; j++)
*5ddc57e5SXin Li                wa2[j] = x[j] - wa1[j];
*5ddc57e5SXin Li            (*evaluate)(wa2, m, data, wf, &(S->userbreak));
*5ddc57e5SXin Li            ++(S->nfev);
*5ddc57e5SXin Li            if (S->userbreak)
*5ddc57e5SXin Li                goto terminate;
*5ddc57e5SXin Li            fnorm1 = lm_enorm(m, wf);
*5ddc57e5SXin Li            if (!isfinite(fnorm1)) {
*5ddc57e5SXin Li                S->outcome = 12; /* nan */
*5ddc57e5SXin Li                goto terminate;
*5ddc57e5SXin Li            }
*5ddc57e5SXin Li
*5ddc57e5SXin Li            /** Evaluate the scaled reduction. **/
*5ddc57e5SXin Li
*5ddc57e5SXin Li            /* Actual scaled reduction. */
*5ddc57e5SXin Li            actred = 1 - SQR(fnorm1 / fnorm);
*5ddc57e5SXin Li
*5ddc57e5SXin Li            /* Ratio of actual to predicted reduction. */
*5ddc57e5SXin Li            ratio = prered ? actred / prered : 0;
*5ddc57e5SXin Li
*5ddc57e5SXin Li            if (C->verbosity == 2) {
*5ddc57e5SXin Li                fprintf(msgfile, "lmmin (%i:%i) ", outer, inner);
*5ddc57e5SXin Li                lm_print_pars(nout, wa2, msgfile); // fnorm1,
*5ddc57e5SXin Li            } else if (C->verbosity >= 3) {
*5ddc57e5SXin Li                printf("%3i %2i %9.2g %9.2g %14.6g"
*5ddc57e5SXin Li                       " %9.2g %10.3e %10.3e %21.15e",
*5ddc57e5SXin Li                       outer, inner, lmpar, prered, ratio,
*5ddc57e5SXin Li                       dirder, delta, pnorm, fnorm1);
*5ddc57e5SXin Li                for (i = 0; i < nout; ++i)
*5ddc57e5SXin Li                    fprintf(msgfile, " %16.9g", wa2[i]);
*5ddc57e5SXin Li                fprintf(msgfile, "\n");
*5ddc57e5SXin Li            }
*5ddc57e5SXin Li
*5ddc57e5SXin Li            /* Update the step bound. */
*5ddc57e5SXin Li            if (ratio <= 0.25) {
*5ddc57e5SXin Li                if (actred >= 0)
*5ddc57e5SXin Li                    temp = 0.5;
*5ddc57e5SXin Li                else if (actred > -99) /* -99 = 1-1/0.1^2 */
*5ddc57e5SXin Li                    temp = MAX(dirder / (2*dirder + actred), 0.1);
*5ddc57e5SXin Li                else
*5ddc57e5SXin Li                    temp = 0.1;
*5ddc57e5SXin Li                delta = temp * MIN(delta, pnorm / 0.1);
*5ddc57e5SXin Li                lmpar /= temp;
*5ddc57e5SXin Li            } else if (ratio >= 0.75) {
*5ddc57e5SXin Li                delta = 2 * pnorm;
*5ddc57e5SXin Li                lmpar *= 0.5;
*5ddc57e5SXin Li            } else if (!lmpar) {
*5ddc57e5SXin Li                delta = 2 * pnorm;
*5ddc57e5SXin Li            }
*5ddc57e5SXin Li
*5ddc57e5SXin Li            /**  On success, update solution, and test for convergence. **/
*5ddc57e5SXin Li
*5ddc57e5SXin Li            inner_success = ratio >= 1e-4;
*5ddc57e5SXin Li            if (inner_success) {
*5ddc57e5SXin Li
*5ddc57e5SXin Li                /* Update x, fvec, and their norms. */
*5ddc57e5SXin Li                if (C->scale_diag) {
*5ddc57e5SXin Li                    for (j = 0; j < n; j++) {
*5ddc57e5SXin Li                        x[j] = wa2[j];
*5ddc57e5SXin Li                        wa2[j] = diag[j] * x[j];
*5ddc57e5SXin Li                    }
*5ddc57e5SXin Li                } else {
*5ddc57e5SXin Li                    for (j = 0; j < n; j++)
*5ddc57e5SXin Li                        x[j] = wa2[j];
*5ddc57e5SXin Li                }
*5ddc57e5SXin Li                for (i = 0; i < m; i++)
*5ddc57e5SXin Li                    fvec[i] = wf[i];
*5ddc57e5SXin Li                xnorm = lm_enorm(n, wa2);
*5ddc57e5SXin Li                if (!isfinite(xnorm)) {
*5ddc57e5SXin Li                    S->outcome = 12; /* nan */
*5ddc57e5SXin Li                    goto terminate;
*5ddc57e5SXin Li                }
*5ddc57e5SXin Li                fnorm = fnorm1;
*5ddc57e5SXin Li            }
*5ddc57e5SXin Li
*5ddc57e5SXin Li            /* Convergence tests. */
*5ddc57e5SXin Li            S->outcome = 0;
*5ddc57e5SXin Li            if (fnorm <= LM_DWARF)
*5ddc57e5SXin Li                goto terminate; /* success: sum of squares almost zero */
*5ddc57e5SXin Li            /* Test two criteria (both may be fulfilled). */
*5ddc57e5SXin Li            if (fabs(actred) <= C->ftol && prered <= C->ftol && ratio <= 2)
*5ddc57e5SXin Li                S->outcome = 1; /* success: x almost stable */
*5ddc57e5SXin Li            if (delta <= C->xtol * xnorm)
*5ddc57e5SXin Li                S->outcome += 2; /* success: sum of squares almost stable */
*5ddc57e5SXin Li            if (S->outcome != 0) {
*5ddc57e5SXin Li                goto terminate;
*5ddc57e5SXin Li            }
*5ddc57e5SXin Li
*5ddc57e5SXin Li            /** Tests for termination and stringent tolerances. **/
*5ddc57e5SXin Li            if (S->nfev >= maxfev) {
*5ddc57e5SXin Li                S->outcome = 5;
*5ddc57e5SXin Li                goto terminate;
*5ddc57e5SXin Li            }
*5ddc57e5SXin Li            if (fabs(actred) <= LM_MACHEP && prered <= LM_MACHEP &&
*5ddc57e5SXin Li                ratio <= 2) {
*5ddc57e5SXin Li                S->outcome = 6;
*5ddc57e5SXin Li                goto terminate;
*5ddc57e5SXin Li            }
*5ddc57e5SXin Li            if (delta <= LM_MACHEP * xnorm) {
*5ddc57e5SXin Li                S->outcome = 7;
*5ddc57e5SXin Li                goto terminate;
*5ddc57e5SXin Li            }
*5ddc57e5SXin Li            if (gnorm <= LM_MACHEP) {
*5ddc57e5SXin Li                S->outcome = 8;
*5ddc57e5SXin Li                goto terminate;
*5ddc57e5SXin Li            }
*5ddc57e5SXin Li
*5ddc57e5SXin Li            /** End of the inner loop. Repeat if iteration unsuccessful. **/
*5ddc57e5SXin Li            ++inner;
*5ddc57e5SXin Li        } while (!inner_success);
*5ddc57e5SXin Li
*5ddc57e5SXin Li    }; /***  End of the outer loop.  ***/
*5ddc57e5SXin Li
*5ddc57e5SXin Literminate:
*5ddc57e5SXin Li    S->fnorm = lm_enorm(m, fvec);
*5ddc57e5SXin Li    if (C->verbosity >= 2)
*5ddc57e5SXin Li        printf("lmmin outcome (%i) xnorm %g ftol %g xtol %g\n", S->outcome,
*5ddc57e5SXin Li               xnorm, C->ftol, C->xtol);
*5ddc57e5SXin Li    if (C->verbosity & 1) {
*5ddc57e5SXin Li        fprintf(msgfile, "lmmin final ");
*5ddc57e5SXin Li        lm_print_pars(nout, x, msgfile); // S->fnorm,
*5ddc57e5SXin Li        fprintf(msgfile, "  fnorm = %18.8g\n", S->fnorm);
*5ddc57e5SXin Li    }
*5ddc57e5SXin Li    if (S->userbreak) /* user-requested break */
*5ddc57e5SXin Li        S->outcome = 11;
*5ddc57e5SXin Li
*5ddc57e5SXin Li    /***  Deallocate the workspace.  ***/
*5ddc57e5SXin Li    free(ws);
*5ddc57e5SXin Li
*5ddc57e5SXin Li} /*** lmmin. ***/
*5ddc57e5SXin Li
*5ddc57e5SXin Li/******************************************************************************/
*5ddc57e5SXin Li/*  lm_lmpar (determine Levenberg-Marquardt parameter)                        */
*5ddc57e5SXin Li/******************************************************************************/
*5ddc57e5SXin Li
*5ddc57e5SXin Livoid lm_lmpar(const int n, double* r, const int ldr, const int* Pivot,
*5ddc57e5SXin Li              const double* diag, const double* qtb, const double delta,
*5ddc57e5SXin Li              double* par, double* x, double* Sdiag, double* aux, double* xdi)
*5ddc57e5SXin Li/*     Given an m by n matrix A, an n by n nonsingular diagonal matrix D,
*5ddc57e5SXin Li *     an m-vector b, and a positive number delta, the problem is to
*5ddc57e5SXin Li *     determine a parameter value par such that if x solves the system
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *          A*x = b  and  sqrt(par)*D*x = 0
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *     in the least squares sense, and dxnorm is the Euclidean norm of D*x,
*5ddc57e5SXin Li *     then either par=0 and (dxnorm-delta) < 0.1*delta, or par>0 and
*5ddc57e5SXin Li *     abs(dxnorm-delta) < 0.1*delta.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *     Using lm_qrsolv, this subroutine completes the solution of the
*5ddc57e5SXin Li *     problem if it is provided with the necessary information from the
*5ddc57e5SXin Li *     QR factorization, with column pivoting, of A. That is, if A*P = Q*R,
*5ddc57e5SXin Li *     where P is a permutation matrix, Q has orthogonal columns, and R is
*5ddc57e5SXin Li *     an upper triangular matrix with diagonal elements of nonincreasing
*5ddc57e5SXin Li *     magnitude, then lmpar expects the full upper triangle of R, the
*5ddc57e5SXin Li *     permutation matrix P, and the first n components of Q^T*b. On output
*5ddc57e5SXin Li *     lmpar also provides an upper triangular matrix S such that
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *          P^T*(A^T*A + par*D*D)*P = S^T*S.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *     S is employed within lmpar and may be of separate interest.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *     Only a few iterations are generally needed for convergence of the
*5ddc57e5SXin Li *     algorithm. If, however, the limit of 10 iterations is reached, then
*5ddc57e5SXin Li *     the output par will contain the best value obtained so far.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *     Parameters:
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      n is a positive integer INPUT variable set to the order of r.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      r is an n by n array. On INPUT the full upper triangle must contain
*5ddc57e5SXin Li *        the full upper triangle of the matrix R. On OUTPUT the full upper
*5ddc57e5SXin Li *        triangle is unaltered, and the strict lower triangle contains the
*5ddc57e5SXin Li *        strict upper triangle (transposed) of the upper triangular matrix S.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      ldr is a positive integer INPUT variable not less than n which
*5ddc57e5SXin Li *        specifies the leading dimension of the array R.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      Pivot is an integer INPUT array of length n which defines the
*5ddc57e5SXin Li *        permutation matrix P such that A*P = Q*R. Column j of P is column
*5ddc57e5SXin Li *        Pivot(j) of the identity matrix.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      diag is an INPUT array of length n which must contain the diagonal
*5ddc57e5SXin Li *        elements of the matrix D.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      qtb is an INPUT array of length n which must contain the first
*5ddc57e5SXin Li *        n elements of the vector Q^T*b.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      delta is a positive INPUT variable which specifies an upper bound
*5ddc57e5SXin Li *        on the Euclidean norm of D*x.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      par is a nonnegative variable. On INPUT par contains an initial
*5ddc57e5SXin Li *        estimate of the Levenberg-Marquardt parameter. On OUTPUT par
*5ddc57e5SXin Li *        contains the final estimate.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      x is an OUTPUT array of length n which contains the least-squares
*5ddc57e5SXin Li *        solution of the system A*x = b, sqrt(par)*D*x = 0, for the output par.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      Sdiag is an array of length n needed as workspace; on OUTPUT it
*5ddc57e5SXin Li *        contains the diagonal elements of the upper triangular matrix S.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      aux is a multi-purpose work array of length n.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      xdi is a work array of length n. On OUTPUT: diag[j] * x[j].
*5ddc57e5SXin Li *
*5ddc57e5SXin Li */
*5ddc57e5SXin Li{
*5ddc57e5SXin Li    int i, iter, j, nsing;
*5ddc57e5SXin Li    double dxnorm, fp, fp_old, gnorm, parc, parl, paru;
*5ddc57e5SXin Li    double sum, temp;
*5ddc57e5SXin Li    static double p1 = 0.1;
*5ddc57e5SXin Li
*5ddc57e5SXin Li    /*** Compute and store in x the Gauss-Newton direction. If the Jacobian
*5ddc57e5SXin Li         is rank-deficient, obtain a least-squares solution. ***/
*5ddc57e5SXin Li
*5ddc57e5SXin Li    nsing = n;
*5ddc57e5SXin Li    for (j = 0; j < n; j++) {
*5ddc57e5SXin Li        aux[j] = qtb[j];
*5ddc57e5SXin Li        if (r[j*ldr+j] == 0 && nsing == n)
*5ddc57e5SXin Li            nsing = j;
*5ddc57e5SXin Li        if (nsing < n)
*5ddc57e5SXin Li            aux[j] = 0;
*5ddc57e5SXin Li    }
*5ddc57e5SXin Li    for (j = nsing-1; j >= 0; j--) {
*5ddc57e5SXin Li        aux[j] = aux[j] / r[j+ldr*j];
*5ddc57e5SXin Li        temp = aux[j];
*5ddc57e5SXin Li        for (i = 0; i < j; i++)
*5ddc57e5SXin Li            aux[i] -= r[j*ldr+i] * temp;
*5ddc57e5SXin Li    }
*5ddc57e5SXin Li
*5ddc57e5SXin Li    for (j = 0; j < n; j++)
*5ddc57e5SXin Li        x[Pivot[j]] = aux[j];
*5ddc57e5SXin Li
*5ddc57e5SXin Li    /*** Initialize the iteration counter, evaluate the function at the origin,
*5ddc57e5SXin Li         and test for acceptance of the Gauss-Newton direction. ***/
*5ddc57e5SXin Li
*5ddc57e5SXin Li    for (j = 0; j < n; j++)
*5ddc57e5SXin Li        xdi[j] = diag[j] * x[j];
*5ddc57e5SXin Li    dxnorm = lm_enorm(n, xdi);
*5ddc57e5SXin Li    fp = dxnorm - delta;
*5ddc57e5SXin Li    if (fp <= p1 * delta) {
*5ddc57e5SXin Li#ifdef LMFIT_DEBUG_MESSAGES
*5ddc57e5SXin Li        printf("debug lmpar nsing=%d, n=%d, terminate[fp<=p1*del]\n", nsing, n);
*5ddc57e5SXin Li#endif
*5ddc57e5SXin Li        *par = 0;
*5ddc57e5SXin Li        return;
*5ddc57e5SXin Li    }
*5ddc57e5SXin Li
*5ddc57e5SXin Li    /*** If the Jacobian is not rank deficient, the Newton step provides a
*5ddc57e5SXin Li         lower bound, parl, for the zero of the function. Otherwise set this
*5ddc57e5SXin Li         bound to zero. ***/
*5ddc57e5SXin Li
*5ddc57e5SXin Li    parl = 0;
*5ddc57e5SXin Li    if (nsing >= n) {
*5ddc57e5SXin Li        for (j = 0; j < n; j++)
*5ddc57e5SXin Li            aux[j] = diag[Pivot[j]] * xdi[Pivot[j]] / dxnorm;
*5ddc57e5SXin Li
*5ddc57e5SXin Li        for (j = 0; j < n; j++) {
*5ddc57e5SXin Li            sum = 0;
*5ddc57e5SXin Li            for (i = 0; i < j; i++)
*5ddc57e5SXin Li                sum += r[j*ldr+i] * aux[i];
*5ddc57e5SXin Li            aux[j] = (aux[j] - sum) / r[j+ldr*j];
*5ddc57e5SXin Li        }
*5ddc57e5SXin Li        temp = lm_enorm(n, aux);
*5ddc57e5SXin Li        parl = fp / delta / temp / temp;
*5ddc57e5SXin Li    }
*5ddc57e5SXin Li
*5ddc57e5SXin Li    /*** Calculate an upper bound, paru, for the zero of the function. ***/
*5ddc57e5SXin Li
*5ddc57e5SXin Li    for (j = 0; j < n; j++) {
*5ddc57e5SXin Li        sum = 0;
*5ddc57e5SXin Li        for (i = 0; i <= j; i++)
*5ddc57e5SXin Li            sum += r[j*ldr+i] * qtb[i];
*5ddc57e5SXin Li        aux[j] = sum / diag[Pivot[j]];
*5ddc57e5SXin Li    }
*5ddc57e5SXin Li    gnorm = lm_enorm(n, aux);
*5ddc57e5SXin Li    paru = gnorm / delta;
*5ddc57e5SXin Li    if (paru == 0)
*5ddc57e5SXin Li        paru = LM_DWARF / MIN(delta, p1);
*5ddc57e5SXin Li
*5ddc57e5SXin Li    /*** If the input par lies outside of the interval (parl,paru),
*5ddc57e5SXin Li         set par to the closer endpoint. ***/
*5ddc57e5SXin Li
*5ddc57e5SXin Li    *par = MAX(*par, parl);
*5ddc57e5SXin Li    *par = MIN(*par, paru);
*5ddc57e5SXin Li    if (*par == 0)
*5ddc57e5SXin Li        *par = gnorm / dxnorm;
*5ddc57e5SXin Li
*5ddc57e5SXin Li    /*** Iterate. ***/
*5ddc57e5SXin Li
*5ddc57e5SXin Li    for (iter = 0;; iter++) {
*5ddc57e5SXin Li
*5ddc57e5SXin Li        /** Evaluate the function at the current value of par. **/
*5ddc57e5SXin Li        if (*par == 0)
*5ddc57e5SXin Li            *par = MAX(LM_DWARF, 0.001 * paru);
*5ddc57e5SXin Li        temp = sqrt(*par);
*5ddc57e5SXin Li        for (j = 0; j < n; j++)
*5ddc57e5SXin Li            aux[j] = temp * diag[j];
*5ddc57e5SXin Li
*5ddc57e5SXin Li        lm_qrsolv(n, r, ldr, Pivot, aux, qtb, x, Sdiag, xdi);
*5ddc57e5SXin Li        /* return values are r, x, Sdiag */
*5ddc57e5SXin Li
*5ddc57e5SXin Li        for (j = 0; j < n; j++)
*5ddc57e5SXin Li            xdi[j] = diag[j] * x[j]; /* used as output */
*5ddc57e5SXin Li        dxnorm = lm_enorm(n, xdi);
*5ddc57e5SXin Li        fp_old = fp;
*5ddc57e5SXin Li        fp = dxnorm - delta;
*5ddc57e5SXin Li
*5ddc57e5SXin Li        /** If the function is small enough, accept the current value
*5ddc57e5SXin Li            of par. Also test for the exceptional cases where parl
*5ddc57e5SXin Li            is zero or the number of iterations has reached 10. **/
*5ddc57e5SXin Li        if (fabs(fp) <= p1 * delta ||
*5ddc57e5SXin Li            (parl == 0 && fp <= fp_old && fp_old < 0) || iter == 10) {
*5ddc57e5SXin Li#ifdef LMFIT_DEBUG_MESSAGES
*5ddc57e5SXin Li            printf("debug lmpar nsing=%d, iter=%d, "
*5ddc57e5SXin Li                   "par=%.4e [%.4e %.4e], delta=%.4e, fp=%.4e\n",
*5ddc57e5SXin Li                   nsing, iter, *par, parl, paru, delta, fp);
*5ddc57e5SXin Li#endif
*5ddc57e5SXin Li            break; /* the only exit from the iteration. */
*5ddc57e5SXin Li        }
*5ddc57e5SXin Li
*5ddc57e5SXin Li        /** Compute the Newton correction. **/
*5ddc57e5SXin Li        for (j = 0; j < n; j++)
*5ddc57e5SXin Li            aux[j] = diag[Pivot[j]] * xdi[Pivot[j]] / dxnorm;
*5ddc57e5SXin Li
*5ddc57e5SXin Li        for (j = 0; j < n; j++) {
*5ddc57e5SXin Li            aux[j] = aux[j] / Sdiag[j];
*5ddc57e5SXin Li            for (i = j+1; i < n; i++)
*5ddc57e5SXin Li                aux[i] -= r[j*ldr+i] * aux[j];
*5ddc57e5SXin Li        }
*5ddc57e5SXin Li        temp = lm_enorm(n, aux);
*5ddc57e5SXin Li        parc = fp / delta / temp / temp;
*5ddc57e5SXin Li
*5ddc57e5SXin Li        /** Depending on the sign of the function, update parl or paru. **/
*5ddc57e5SXin Li        if (fp > 0)
*5ddc57e5SXin Li            parl = MAX(parl, *par);
*5ddc57e5SXin Li        else /* fp < 0 [the case fp==0 is precluded by the break condition] */
*5ddc57e5SXin Li            paru = MIN(paru, *par);
*5ddc57e5SXin Li
*5ddc57e5SXin Li        /** Compute an improved estimate for par. **/
*5ddc57e5SXin Li        *par = MAX(parl, *par + parc);
*5ddc57e5SXin Li    }
*5ddc57e5SXin Li
*5ddc57e5SXin Li} /*** lm_lmpar. ***/
*5ddc57e5SXin Li
*5ddc57e5SXin Li/******************************************************************************/
*5ddc57e5SXin Li/*  lm_qrfac (QR factorization, from lapack)                                  */
*5ddc57e5SXin Li/******************************************************************************/
*5ddc57e5SXin Li
*5ddc57e5SXin Livoid lm_qrfac(const int m, const int n, double* A, int* Pivot, double* Rdiag,
*5ddc57e5SXin Li              double* Acnorm, double* W)
*5ddc57e5SXin Li/*
*5ddc57e5SXin Li *     This subroutine uses Householder transformations with column pivoting
*5ddc57e5SXin Li *     to compute a QR factorization of the m by n matrix A. That is, qrfac
*5ddc57e5SXin Li *     determines an orthogonal matrix Q, a permutation matrix P, and an
*5ddc57e5SXin Li *     upper trapezoidal matrix R with diagonal elements of nonincreasing
*5ddc57e5SXin Li *     magnitude, such that A*P = Q*R. The Householder transformation for
*5ddc57e5SXin Li *     column k, k = 1,2,...,n, is of the form
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *          I - 2*w*wT/|w|^2
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *     where w has zeroes in the first k-1 positions.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *     Parameters:
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      m is an INPUT parameter set to the number of rows of A.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      n is an INPUT parameter set to the number of columns of A.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      A is an m by n array. On INPUT, A contains the matrix for which the
*5ddc57e5SXin Li *        QR factorization is to be computed. On OUTPUT the strict upper
*5ddc57e5SXin Li *        trapezoidal part of A contains the strict upper trapezoidal part
*5ddc57e5SXin Li *        of R, and the lower trapezoidal part of A contains a factored form
*5ddc57e5SXin Li *        of Q (the non-trivial elements of the vectors w described above).
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      Pivot is an integer OUTPUT array of length n that describes the
*5ddc57e5SXin Li *        permutation matrix P. Column j of P is column Pivot(j) of the
*5ddc57e5SXin Li *        identity matrix.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      Rdiag is an OUTPUT array of length n which contains the diagonal
*5ddc57e5SXin Li *        elements of R.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      Acnorm is an OUTPUT array of length n which contains the norms of
*5ddc57e5SXin Li *        the corresponding columns of the input matrix A. If this information
*5ddc57e5SXin Li *        is not needed, then Acnorm can share storage with Rdiag.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      W is a work array of length n.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li */
*5ddc57e5SXin Li{
*5ddc57e5SXin Li    int i, j, k, kmax;
*5ddc57e5SXin Li    double ajnorm, sum, temp;
*5ddc57e5SXin Li
*5ddc57e5SXin Li#ifdef LMFIT_DEBUG_MESSAGES
*5ddc57e5SXin Li    printf("debug qrfac\n");
*5ddc57e5SXin Li#endif
*5ddc57e5SXin Li
*5ddc57e5SXin Li    /** Compute initial column norms;
*5ddc57e5SXin Li        initialize Pivot with identity permutation. ***/
*5ddc57e5SXin Li    for (j = 0; j < n; j++) {
*5ddc57e5SXin Li        W[j] = Rdiag[j] = Acnorm[j] = lm_enorm(m, &A[j*m]);
*5ddc57e5SXin Li        Pivot[j] = j;
*5ddc57e5SXin Li    }
*5ddc57e5SXin Li
*5ddc57e5SXin Li    /** Loop over columns of A. **/
*5ddc57e5SXin Li    assert(n <= m);
*5ddc57e5SXin Li    for (j = 0; j < n; j++) {
*5ddc57e5SXin Li
*5ddc57e5SXin Li        /** Bring the column of largest norm into the pivot position. **/
*5ddc57e5SXin Li        kmax = j;
*5ddc57e5SXin Li        for (k = j+1; k < n; k++)
*5ddc57e5SXin Li            if (Rdiag[k] > Rdiag[kmax])
*5ddc57e5SXin Li                kmax = k;
*5ddc57e5SXin Li
*5ddc57e5SXin Li        if (kmax != j) {
*5ddc57e5SXin Li            /* Swap columns j and kmax. */
*5ddc57e5SXin Li            k = Pivot[j];
*5ddc57e5SXin Li            Pivot[j] = Pivot[kmax];
*5ddc57e5SXin Li            Pivot[kmax] = k;
*5ddc57e5SXin Li            for (i = 0; i < m; i++) {
*5ddc57e5SXin Li                temp = A[j*m+i];
*5ddc57e5SXin Li                A[j*m+i] = A[kmax*m+i];
*5ddc57e5SXin Li                A[kmax*m+i] = temp;
*5ddc57e5SXin Li            }
*5ddc57e5SXin Li            /* Half-swap: Rdiag[j], W[j] won't be needed any further. */
*5ddc57e5SXin Li            Rdiag[kmax] = Rdiag[j];
*5ddc57e5SXin Li            W[kmax] = W[j];
*5ddc57e5SXin Li        }
*5ddc57e5SXin Li
*5ddc57e5SXin Li        /** Compute the Householder reflection vector w_j to reduce the
*5ddc57e5SXin Li            j-th column of A to a multiple of the j-th unit vector. **/
*5ddc57e5SXin Li        ajnorm = lm_enorm(m-j, &A[j*m+j]);
*5ddc57e5SXin Li        if (ajnorm == 0) {
*5ddc57e5SXin Li            Rdiag[j] = 0;
*5ddc57e5SXin Li            continue;
*5ddc57e5SXin Li        }
*5ddc57e5SXin Li
*5ddc57e5SXin Li        /* Let the partial column vector A[j][j:] contain w_j := e_j+-a_j/|a_j|,
*5ddc57e5SXin Li           where the sign +- is chosen to avoid cancellation in w_jj. */
*5ddc57e5SXin Li        if (A[j*m+j] < 0)
*5ddc57e5SXin Li            ajnorm = -ajnorm;
*5ddc57e5SXin Li        for (i = j; i < m; i++)
*5ddc57e5SXin Li            A[j*m+i] /= ajnorm;
*5ddc57e5SXin Li        A[j*m+j] += 1;
*5ddc57e5SXin Li
*5ddc57e5SXin Li        /** Apply the Householder transformation U_w := 1 - 2*w_j.w_j/|w_j|^2
*5ddc57e5SXin Li            to the remaining columns, and update the norms. **/
*5ddc57e5SXin Li        for (k = j+1; k < n; k++) {
*5ddc57e5SXin Li            /* Compute scalar product w_j * a_j. */
*5ddc57e5SXin Li            sum = 0;
*5ddc57e5SXin Li            for (i = j; i < m; i++)
*5ddc57e5SXin Li                sum += A[j*m+i] * A[k*m+i];
*5ddc57e5SXin Li
*5ddc57e5SXin Li            /* Normalization is simplified by the coincidence |w_j|^2=2w_jj. */
*5ddc57e5SXin Li            temp = sum / A[j*m+j];
*5ddc57e5SXin Li
*5ddc57e5SXin Li            /* Carry out transform U_w_j * a_k. */
*5ddc57e5SXin Li            for (i = j; i < m; i++)
*5ddc57e5SXin Li                A[k*m+i] -= temp * A[j*m+i];
*5ddc57e5SXin Li
*5ddc57e5SXin Li            /* No idea what happens here. */
*5ddc57e5SXin Li            if (Rdiag[k] != 0) {
*5ddc57e5SXin Li                temp = A[m*k+j] / Rdiag[k];
*5ddc57e5SXin Li                if (fabs(temp) < 1) {
*5ddc57e5SXin Li                    Rdiag[k] *= sqrt(1 - SQR(temp));
*5ddc57e5SXin Li                    temp = Rdiag[k] / W[k];
*5ddc57e5SXin Li                } else
*5ddc57e5SXin Li                    temp = 0;
*5ddc57e5SXin Li                if (temp == 0 || 0.05 * SQR(temp) <= LM_MACHEP) {
*5ddc57e5SXin Li                    Rdiag[k] = lm_enorm(m-j-1, &A[m*k+j+1]);
*5ddc57e5SXin Li                    W[k] = Rdiag[k];
*5ddc57e5SXin Li                }
*5ddc57e5SXin Li            }
*5ddc57e5SXin Li        }
*5ddc57e5SXin Li
*5ddc57e5SXin Li        Rdiag[j] = -ajnorm;
*5ddc57e5SXin Li    }
*5ddc57e5SXin Li} /*** lm_qrfac. ***/
*5ddc57e5SXin Li
*5ddc57e5SXin Li/******************************************************************************/
*5ddc57e5SXin Li/*  lm_qrsolv (linear least-squares)                                          */
*5ddc57e5SXin Li/******************************************************************************/
*5ddc57e5SXin Li
*5ddc57e5SXin Livoid lm_qrsolv(const int n, double* r, const int ldr, const int* Pivot,
*5ddc57e5SXin Li               const double* diag, const double* qtb, double* x,
*5ddc57e5SXin Li               double* Sdiag, double* W)
*5ddc57e5SXin Li/*
*5ddc57e5SXin Li *     Given an m by n matrix A, an n by n diagonal matrix D, and an
*5ddc57e5SXin Li *     m-vector b, the problem is to determine an x which solves the
*5ddc57e5SXin Li *     system
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *          A*x = b  and  D*x = 0
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *     in the least squares sense.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *     This subroutine completes the solution of the problem if it is
*5ddc57e5SXin Li *     provided with the necessary information from the QR factorization,
*5ddc57e5SXin Li *     with column pivoting, of A. That is, if A*P = Q*R, where P is a
*5ddc57e5SXin Li *     permutation matrix, Q has orthogonal columns, and R is an upper
*5ddc57e5SXin Li *     triangular matrix with diagonal elements of nonincreasing magnitude,
*5ddc57e5SXin Li *     then qrsolv expects the full upper triangle of R, the permutation
*5ddc57e5SXin Li *     matrix P, and the first n components of Q^T*b. The system
*5ddc57e5SXin Li *     A*x = b, D*x = 0, is then equivalent to
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *          R*z = Q^T*b,  P^T*D*P*z = 0,
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *     where x = P*z. If this system does not have full rank, then a least
*5ddc57e5SXin Li *     squares solution is obtained. On output qrsolv also provides an upper
*5ddc57e5SXin Li *     triangular matrix S such that
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *          P^T*(A^T*A + D*D)*P = S^T*S.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *     S is computed within qrsolv and may be of separate interest.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *     Parameters:
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      n is a positive integer INPUT variable set to the order of R.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      r is an n by n array. On INPUT the full upper triangle must contain
*5ddc57e5SXin Li *        the full upper triangle of the matrix R. On OUTPUT the full upper
*5ddc57e5SXin Li *        triangle is unaltered, and the strict lower triangle contains the
*5ddc57e5SXin Li *        strict upper triangle (transposed) of the upper triangular matrix S.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      ldr is a positive integer INPUT variable not less than n which
*5ddc57e5SXin Li *        specifies the leading dimension of the array R.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      Pivot is an integer INPUT array of length n which defines the
*5ddc57e5SXin Li *        permutation matrix P such that A*P = Q*R. Column j of P is column
*5ddc57e5SXin Li *        Pivot(j) of the identity matrix.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      diag is an INPUT array of length n which must contain the diagonal
*5ddc57e5SXin Li *        elements of the matrix D.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      qtb is an INPUT array of length n which must contain the first
*5ddc57e5SXin Li *        n elements of the vector Q^T*b.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      x is an OUTPUT array of length n which contains the least-squares
*5ddc57e5SXin Li *        solution of the system A*x = b, D*x = 0.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      Sdiag is an OUTPUT array of length n which contains the diagonal
*5ddc57e5SXin Li *        elements of the upper triangular matrix S.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      W is a work array of length n.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li */
*5ddc57e5SXin Li{
*5ddc57e5SXin Li    int i, kk, j, k, nsing;
*5ddc57e5SXin Li    double qtbpj, sum, temp;
*5ddc57e5SXin Li    double _sin, _cos, _tan, _cot; /* local variables, not functions */
*5ddc57e5SXin Li
*5ddc57e5SXin Li    /*** Copy R and Q^T*b to preserve input and initialize S.
*5ddc57e5SXin Li         In particular, save the diagonal elements of R in x. ***/
*5ddc57e5SXin Li
*5ddc57e5SXin Li    for (j = 0; j < n; j++) {
*5ddc57e5SXin Li        for (i = j; i < n; i++)
*5ddc57e5SXin Li            r[j*ldr+i] = r[i*ldr+j];
*5ddc57e5SXin Li        x[j] = r[j*ldr+j];
*5ddc57e5SXin Li        W[j] = qtb[j];
*5ddc57e5SXin Li    }
*5ddc57e5SXin Li
*5ddc57e5SXin Li    /*** Eliminate the diagonal matrix D using a Givens rotation. ***/
*5ddc57e5SXin Li
*5ddc57e5SXin Li    for (j = 0; j < n; j++) {
*5ddc57e5SXin Li
*5ddc57e5SXin Li        /*** Prepare the row of D to be eliminated, locating the diagonal
*5ddc57e5SXin Li             element using P from the QR factorization. ***/
*5ddc57e5SXin Li
*5ddc57e5SXin Li        if (diag[Pivot[j]] != 0) {
*5ddc57e5SXin Li            for (k = j; k < n; k++)
*5ddc57e5SXin Li                Sdiag[k] = 0;
*5ddc57e5SXin Li            Sdiag[j] = diag[Pivot[j]];
*5ddc57e5SXin Li
*5ddc57e5SXin Li            /*** The transformations to eliminate the row of D modify only
*5ddc57e5SXin Li                 a single element of Q^T*b beyond the first n, which is
*5ddc57e5SXin Li                 initially 0. ***/
*5ddc57e5SXin Li
*5ddc57e5SXin Li            qtbpj = 0;
*5ddc57e5SXin Li            for (k = j; k < n; k++) {
*5ddc57e5SXin Li
*5ddc57e5SXin Li                /** Determine a Givens rotation which eliminates the
*5ddc57e5SXin Li                    appropriate element in the current row of D. **/
*5ddc57e5SXin Li                if (Sdiag[k] == 0)
*5ddc57e5SXin Li                    continue;
*5ddc57e5SXin Li                kk = k + ldr * k;
*5ddc57e5SXin Li                if (fabs(r[kk]) < fabs(Sdiag[k])) {
*5ddc57e5SXin Li                    _cot = r[kk] / Sdiag[k];
*5ddc57e5SXin Li                    _sin = 1 / hypot(1, _cot);
*5ddc57e5SXin Li                    _cos = _sin * _cot;
*5ddc57e5SXin Li                } else {
*5ddc57e5SXin Li                    _tan = Sdiag[k] / r[kk];
*5ddc57e5SXin Li                    _cos = 1 / hypot(1, _tan);
*5ddc57e5SXin Li                    _sin = _cos * _tan;
*5ddc57e5SXin Li                }
*5ddc57e5SXin Li
*5ddc57e5SXin Li                /** Compute the modified diagonal element of R and
*5ddc57e5SXin Li                    the modified element of (Q^T*b,0). **/
*5ddc57e5SXin Li                r[kk] = _cos * r[kk] + _sin * Sdiag[k];
*5ddc57e5SXin Li                temp = _cos * W[k] + _sin * qtbpj;
*5ddc57e5SXin Li                qtbpj = -_sin * W[k] + _cos * qtbpj;
*5ddc57e5SXin Li                W[k] = temp;
*5ddc57e5SXin Li
*5ddc57e5SXin Li                /** Accumulate the tranformation in the row of S. **/
*5ddc57e5SXin Li                for (i = k+1; i < n; i++) {
*5ddc57e5SXin Li                    temp = _cos * r[k*ldr+i] + _sin * Sdiag[i];
*5ddc57e5SXin Li                    Sdiag[i] = -_sin * r[k*ldr+i] + _cos * Sdiag[i];
*5ddc57e5SXin Li                    r[k*ldr+i] = temp;
*5ddc57e5SXin Li                }
*5ddc57e5SXin Li            }
*5ddc57e5SXin Li        }
*5ddc57e5SXin Li
*5ddc57e5SXin Li        /** Store the diagonal element of S and restore
*5ddc57e5SXin Li            the corresponding diagonal element of R. **/
*5ddc57e5SXin Li        Sdiag[j] = r[j*ldr+j];
*5ddc57e5SXin Li        r[j*ldr+j] = x[j];
*5ddc57e5SXin Li    }
*5ddc57e5SXin Li
*5ddc57e5SXin Li    /*** Solve the triangular system for z. If the system is singular, then
*5ddc57e5SXin Li        obtain a least-squares solution. ***/
*5ddc57e5SXin Li
*5ddc57e5SXin Li    nsing = n;
*5ddc57e5SXin Li    for (j = 0; j < n; j++) {
*5ddc57e5SXin Li        if (Sdiag[j] == 0 && nsing == n)
*5ddc57e5SXin Li            nsing = j;
*5ddc57e5SXin Li        if (nsing < n)
*5ddc57e5SXin Li            W[j] = 0;
*5ddc57e5SXin Li    }
*5ddc57e5SXin Li
*5ddc57e5SXin Li    for (j = nsing-1; j >= 0; j--) {
*5ddc57e5SXin Li        sum = 0;
*5ddc57e5SXin Li        for (i = j+1; i < nsing; i++)
*5ddc57e5SXin Li            sum += r[j*ldr+i] * W[i];
*5ddc57e5SXin Li        W[j] = (W[j] - sum) / Sdiag[j];
*5ddc57e5SXin Li    }
*5ddc57e5SXin Li
*5ddc57e5SXin Li    /*** Permute the components of z back to components of x. ***/
*5ddc57e5SXin Li
*5ddc57e5SXin Li    for (j = 0; j < n; j++)
*5ddc57e5SXin Li        x[Pivot[j]] = W[j];
*5ddc57e5SXin Li
*5ddc57e5SXin Li} /*** lm_qrsolv. ***/
*5ddc57e5SXin Li
*5ddc57e5SXin Li/******************************************************************************/
*5ddc57e5SXin Li/*  lm_enorm (Euclidean norm)                                                 */
*5ddc57e5SXin Li/******************************************************************************/
*5ddc57e5SXin Li
*5ddc57e5SXin Lidouble lm_enorm(int n, const double* x)
*5ddc57e5SXin Li/*     This function calculates the Euclidean norm of an n-vector x.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *     The Euclidean norm is computed by accumulating the sum of squares
*5ddc57e5SXin Li *     in three different sums. The sums of squares for the small and large
*5ddc57e5SXin Li *     components are scaled so that no overflows occur. Non-destructive
*5ddc57e5SXin Li *     underflows are permitted. Underflows and overflows do not occur in
*5ddc57e5SXin Li *     the computation of the unscaled sum of squares for the intermediate
*5ddc57e5SXin Li *     components. The definitions of small, intermediate and large components
*5ddc57e5SXin Li *     depend on two constants, LM_SQRT_DWARF and LM_SQRT_GIANT. The main
*5ddc57e5SXin Li *     restrictions on these constants are that LM_SQRT_DWARF**2 not underflow
*5ddc57e5SXin Li *     and LM_SQRT_GIANT**2 not overflow.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *     Parameters:
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      n is a positive integer INPUT variable.
*5ddc57e5SXin Li *
*5ddc57e5SXin Li *      x is an INPUT array of length n.
*5ddc57e5SXin Li */
*5ddc57e5SXin Li{
*5ddc57e5SXin Li    int i;
*5ddc57e5SXin Li    double agiant, s1, s2, s3, xabs, x1max, x3max;
*5ddc57e5SXin Li
*5ddc57e5SXin Li    s1 = 0;
*5ddc57e5SXin Li    s2 = 0;
*5ddc57e5SXin Li    s3 = 0;
*5ddc57e5SXin Li    x1max = 0;
*5ddc57e5SXin Li    x3max = 0;
*5ddc57e5SXin Li    agiant = LM_SQRT_GIANT / n;
*5ddc57e5SXin Li
*5ddc57e5SXin Li    /** Sum squares. **/
*5ddc57e5SXin Li    for (i = 0; i < n; i++) {
*5ddc57e5SXin Li        xabs = fabs(x[i]);
*5ddc57e5SXin Li        if (xabs > LM_SQRT_DWARF) {
*5ddc57e5SXin Li            if (xabs < agiant) {
*5ddc57e5SXin Li                s2 += SQR(xabs);
*5ddc57e5SXin Li            } else if (xabs > x1max) {
*5ddc57e5SXin Li                s1 = 1 + s1 * SQR(x1max / xabs);
*5ddc57e5SXin Li                x1max = xabs;
*5ddc57e5SXin Li            } else {
*5ddc57e5SXin Li                s1 += SQR(xabs / x1max);
*5ddc57e5SXin Li            }
*5ddc57e5SXin Li        } else if (xabs > x3max) {
*5ddc57e5SXin Li            s3 = 1 + s3 * SQR(x3max / xabs);
*5ddc57e5SXin Li            x3max = xabs;
*5ddc57e5SXin Li        } else if (xabs != 0) {
*5ddc57e5SXin Li            s3 += SQR(xabs / x3max);
*5ddc57e5SXin Li        }
*5ddc57e5SXin Li    }
*5ddc57e5SXin Li
*5ddc57e5SXin Li    /** Calculate the norm. **/
*5ddc57e5SXin Li    if (s1 != 0)
*5ddc57e5SXin Li        return x1max * sqrt(s1 + (s2 / x1max) / x1max);
*5ddc57e5SXin Li    else if (s2 != 0)
*5ddc57e5SXin Li        if (s2 >= x3max)
*5ddc57e5SXin Li            return sqrt(s2 * (1 + (x3max / s2) * (x3max * s3)));
*5ddc57e5SXin Li        else
*5ddc57e5SXin Li            return sqrt(x3max * ((s2 / x3max) + (x3max * s3)));
*5ddc57e5SXin Li    else
*5ddc57e5SXin Li        return x3max * sqrt(s3);
*5ddc57e5SXin Li
*5ddc57e5SXin Li} /*** lm_enorm. ***/