Данные для программы CLINP 2.1
Модель равновесий
Ход и результаты расчетов
Входная информация для программы СLINP 2.1 делится на обязательную и дополнительную. Первая необходима при обработке любых данных, наличие второй определяется особенностями исследуемой системы и (или) экспериментального метода.
ОБЯЗАТЕЛЬНАЯ ИНФОРМАЦИЯ
ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ
Блоки входной информации о моделируемой системе, параметрах, регулирующих ход расчетов и характере выводимых результатов формируются по шаблону на
отдельных листах файла Microsoft Excel (расширение xls). Обязательная информация размещена на листах Parameters, Stoichiometry, Logarithms of Constants, Transformation, Measured properties, Total Concentrations, Weights, Intensity Factors, а дополнительная – на листах Phase Pointers и Volume Ratios.СВЕДЕНИЯ О МОДЕЛИ РАВНОВЕСИЙ, ИЗМЕРЯЕМЫХ СВОЙСТВАХ И ПОДГОТОВКА ДАННЫХ
Статистические веса и модель экспериментальных погрешностей
ЛИСТЫ ФАЙЛА Microsoft Excel, ХОД И РЕЗУЛЬТАТЫ РАСЧЕТОВ
Размещение информации на листах файлов Microsoft Excel
Перекрестная оценка достоверности (Cross-Validation)
N – число изученных смесей;
L
– число аналитических позиций (например, длин волн при спектрофотометрическом изучении равновесий);W
– число реагентов с неизвестными факторами интенсивности;Li – реагент (химическая форма, species) под номером i ;
b
i – константа устойчивости i-го реагента;LKu – неизвестный параметр под номером u;
a
li – фактор интенсивности реагента Li для l-й аналитической позиции.Реакции записываются в канонической форме (см.
примеры):
где B
j – подмножество реагентов, называемое независимыми компонентами. Количество независимых компонентов Y равно количеству реагентов (S) за вычетом количества реакций между ними (r): Y = S - r. Независимые компоненты Bj друг в друга при реакциях не переходят. В число реакций обязательно следует включить тривиальные – получения компонентов Bj из самих себя с константой равновесий 1 (логарифм константы 0). Стехиометрические коэффициенты nij могут быть положительными, отрицательными или принимать нулевые значения. Они могут быть как целыми, так и дробными числами.Стехиометрические коэффициенты образуют стехиометрическую матрицу ||
nij|| размером Sґ Y.Первыми в стехиометрической матрице записываются уравнения реакций получения
W веществ, для которых факторы интенсивности реагентов неизвестны.См.
подробные примерыПредполагается, что в исследуемой системе коэффициенты активности реагентов постоянны (например, благодаря введению в раствор избытка фонового электролита). Это позволяет пользоваться концентрационными константами равновесия и записывать уравнения закона действия масс (ЗДМ) в виде
где величины в квадратных скобках – равновесные концентрации,
bi – концентрационная константа устойчивости формы Li. Если экспериментально определена активность компонента Bk, равновесную концентрацию [Bk] заменяют оценкой активности a(Bk); константы устойчивости тех форм Li, для которых стехиометрические коэффициенты nik не равны 0, являются не концентрационными, а смешанными. В химии комплексообразующих кремнеземов эта модель носит название “модели химических реакций”.1) логарифмы р неизвестных констант равновесия;
2) факторы интенсивности первых W реагентов в стехиометрической матрице для каждой из L аналитических позиций. В методе спектрофотометрии факторы интенсивности– молярные коэффициенты поглощения, аналитические позиции – длины волн.
Общее число искомых параметров z = p + L ґ W .
Логарифмы неизвестных констант устойчивости комплексов (химических форм, species) L
i рассматриваются как функции подлежащих расчету параметров LKu (их количество р должно быть равно числу неизвестных констант устойчивости форм Li ): ,
где lg
bi0 – неменяемый вклад в lg bi, LKu – искомые параметры, tiu – элементы матрицы T размером pґ p преобразования параметров LKu в lg bi. См. листы Logarithms of constants, Transformation.Используемая форма представления информации об искомых параметрах позволяет гибко варьировать перечень искомых параметров, переходя, например, от расчета общих к определению ступенчатых констант устойчивости.
См.
подробные примерыДля обработки пригодны свойства равновесной системы (А), которые меняются при варьировании ее начального состава. Величины свойства А измеряют для N смесей реагентов при L і 1 аналитических позиций (аналитической позицией называют канал измерения свойств, скажем, длину волны света в спектрофотометрии):
Alk = f(l l, n*k),
где k – номер исследуемой равновесной смеси, 1
Ј k Ј N, l – аналитическая позиция,l – ее номер, 1
Ј l Ј L , n*k – вектор исходных (известных по условиям смешивания) количеств вещества реагентов в k-й исследуемой смеси.Величины A
lk образуют матрицу измеренных свойств размером L ґ N.Измеряемые свойства должны быть линейными комбинациями равновесных концентраций реагентов:
,
где L
i – реагенты, S – их количество, [Li]k – равновесная концентрация реагента Li в k-й смеси, ali – известный или подлежащий определению фактор интенсивности реагента Li для аналитической позиции ll.Факторы интенсивности образуют матрицу E размером
L ґ S, размещаемую на листе Intensity Factors.См.
примерыПрограмма позволяет обрабатывать данные, полученные методами спектрофотометрии, растворимости, распределения, потенциометрии и др. (см. примеры).
В случае метода растворимости элементами матрицы А являются измеренные величины растворимости осадка.
Для метода спектрофотометрии
элементы матрицы А – величины светопоглощения, деленные на длину светопоглощающего слоя.В методе распределения изучают распределение некоторого компонента Х между фазами I (раствор веществ в растворителе I) и II (раствор в растворителе II или сорбент), причем в каждой точке зависимости состав – свойство точно известны объем фазы I (V
I) и объем (VII) (при исследовании экстракционных равновесий) или масса (mII) (при изучении сорбционных процессов) фазы II. По результатам экспериментов исследователю должны быть доступны по крайней мере две величины из списка: n0(X); RD; t[X]; t{X}, где n0(X) – общее количества вещества Х в системе, моль; RD – коэффициент распределения Х между фазамиRD = t{X} / t[X],
общая концентрация Х-содержащих реагентов в фазе II (моль/г фазы II при исследовании сорбционных равновесий; моль/л фазы II при изучении экстракции);
общая концентрация Х-содержащих реагентов в фазе I, моль/л фазы I, фигурными скобками выделены равновесные концентрации реагентов в фазе II, квадратными – в фазе I.
Зная две из указанных величин, легко вычислить остальные. Так, если при исследовании сорбционных равновесий компонента Х стали известны n
0(X) и RD,t[X] = n0(X) / (VI + RDЧ mII),
t{X} = n0(X) ґ RD / (VI + RDЧ mII).
При моделировании равновесий в качестве величин, аппроксимируемых моделью, выбирают t
[X] или t{X}. В первом случае в программу CLINP 2.1 передается величина свойстваА = t
[X],а во втором случае А определяют по формуле
где V
I, VII – объемы фаз I и II соответственно, mII – масса фазы II (сорбента).
Измерения методом потенциометрии, в зависимости от способа градуировки потенциометрической цепи, предоставляют информацию о логарифмах активностей или равновесных концентраций некоторого реагента Х. Если получены сведения о lg [X], в программу в качестве величины свойства А передаются величины 10
lg [X].Если экспериментально получены оценки активностей a(X) (например, a(H
+) = 10-pH в рН-метрических исследованиях), следует, используя gX – коэффициенты активности X в исследуемых растворах, рассчитать значения [X] = a(X) / gX и передать их программе CLINP 2.1 в качестве измеренных свойств равновесных систем. Пересчет необходим, если выполнялись рН-метрические измерения при рН < 3.5 или pH > 10.5, когда вкладом равновесных концентраций [H+] или [OH-] в общие концентрации t(H+) – величины порядка 10-3–10-1 при исследовании равновесий в растворах – пренебречь нельзя. Необходимые значения коэффициентов активностей для температуры 298 К можно рассчитать по формуле,
где I – ионная сила раствора, моль/л, коэффициенты a и b для различных фоновых электролитов можно найти в книге [Комарь Н.П. Химическая метрология. Гомогенные ионные равновесия. Харьков: Вища школа, 1983].
Коэффициенты уравнения для расчета коэффициентов активности ионов водорода в водно-солевых растворах
Электролит |
a |
b |
NaCl |
4.20 |
0.22 |
KCl |
6.10 |
0.113 |
KNO3 |
8.02 |
0.092 |
NaClO4 |
9.30 |
0.16 |
Пересчет оценок активностей в равновесные концентрации обеспечивает расчет концентрационных констант равновесия; если пересчет активностей в концентрации не выполнялся, определяемые по программе CLINP 2.1 константы равновесия реакций, в которых участвуют ионы Н
+, будут смешанными.Инвариантами системы являются количества вещества независимых компонентов (см. Запись реакций). Если реакции происходят в растворах, объем которых при этом не меняется, инвариантами являются и общие (аналитические) концентрации компонентов, моль/л:
,
где c(L
i) – начальные (известные по условиям смешивания реагентов) концентрации Li. Эта система уравнений задает условия материального баланса (лист Total Cоncentrations)Статистические веса и модель экспериментальных погрешностей
На основе представлений об экспериментальных погрешностях пользователь назначает статистические веса wlk.
Разумно принять, что все экспериментальные величины, кроме свойства А, измерены точно.
Если A
lk измерены с одинаковой погрешностью s (такую модель часто применяют при обработке спектрофотометрических данных), то всем измерениям назначают одинаковые статистические весаwlk = 1 / s2.
Если измерения A
lk выполнены с одинаковой относительной погрешностью sr, пользователь должен назначить веса в соответствии с формулой.
Эти и другие способы выбора статистических весов (см., например, [Хартли Ф., Бергес К., Олкок Р. Равновесия в растворах. М.: Мир, 1983]) пользователь легко реализует с помощью средств работы с формулами Microsoft Excel.
Размещение информации на листах файлов Microsoft Excel
Лист Parameters содержит заданные по умолчанию и доступные для изменения пользователем значения параметров, управляющих расчетами. См. подробную характеристку параметров, управляющих ходом расчетов.
Значение параметра |
Текст на листе Microsoft Excel |
Русский перевод |
Комментарий |
100 |
The maximum number of iterations |
Максимальное число итераций |
Максимально допустимое число итераций уточнения LK u при фиксированном значении s . |
0 |
Per cent of outliers |
Процент грубых выбросов |
Процент грубых выбросов 0 Ј d Ј 99 (0 – задача наименьших квадратов, 99 – задача метода наименьших модулей). |
0 |
Method of calculation 0 – quasi-Newton, 1 – Gauss-Newton |
Method расчета 0 – квази-Ньютон, 1 – Гаусс-Ньютон |
|
5,00E-06 |
Minimum relative value of gradient |
Минимальное относительное значение градиента |
Основной критерий остановки расчетов. Рекомендуется (1-10)*10-6. |
1,00E-06 |
Minimum length of step |
Минимальная длина шага |
Рекомендуется 10 -6. |
1 |
Maximum length of step |
Максимальная длина шага |
Рекомендуется 0.5-1. |
10 |
The typical value of parameters to be found |
Типичные значения искомых параметров |
Рекомендуются 1 – 10. |
25 |
The typical value of criterion function |
Типичное значение критериальной функции |
Рекомендуется 1 – 200. |
1,00E-06 |
Minimum relative value of step |
Минимальная относительная длина шага |
Критерий остановки расчетов. Рекомендуется (1-10)*10-6. |
0,0001 |
The parameter of Armijo condition |
Параметр условия Армио |
Параметр, регулирующий длину шага l при линейном поиске. Рекомендуется 10-4. |
0/1 |
Cross-validation |
Кросс-валидация
|
1 – выполнить кросс-валидацию, 0 – не выполнять. |
0/1 |
Transposition |
Транспонирование |
0 – матрицы измеренных свойств, весов, факторов интенсивности вводятся так, как описано в тексте и показано в примерах; 1 – матрицы вводятся в транспонированном виде. |
0/1 |
Information about calculation process |
Расширенная информация о процессе расчетов. |
0 – расширенная информация не выводится; 1 – в дополнительное окно выводится информация о величине критериальной функции, значениях параметров, матрицах первых и вторых производных на каждой итерации. |
oichiometry
Размещается стехиометрическая матрица
В порядке записи реакций в стехиометрической матрице формируется столбец, содержащий величины lg
bi. Вместо неизвестных lg bi записываются начальные приближения искомых параметров LKu (их выделяют красным цветом). Если имеется хотя бы один не равный нулю неменяемый вклад lg bi0, рядом со столбцом lg bi формируется столбец lg bi0, причем для точно известных lg bi элементами столбца lg bi0 являются нули.Записываются элементы матрицы Т.
Cодержатся величины измеренных свойств равновесных систем. Номера строк соответствуют номерам изученных смесей k, k =1, 2, ..., N, а номера столбцов – номерам аналитических позиций ll, l = 1, 2, ..., L.
Приводятся общие концентрации tj независимых компонентов Bj во всех экспериментальных точках. Номера строк соответствуют номерам изученных смесей k, k =1, 2, ..., N, а номера столбцов – номерам компонентов Bj, j = 1, 2, ..., Y. В каждой экспериментальной точке общие концентрации tj, моль/л, рассчитываются по формуле, связывающей tj с начальными концентрациями реагентов с(Li):
,
Учитывая многообразие применяемых на практике схем организации эксперимента, мы не стремились предусмотреть в программе все возможные способы вычисления t
j. Для подготовки tj следует пользоваться средствами Excel для работы с формулами.Если изучалось комплексообразование в двухфазной системе, все t
j должны быть пересчитаны на объем фазы I и измеряться в моль/л.При некоторых схемах эксперимента кpоме величин выбpанного свойства системы (скажем, светопоглощения раствора или растворимости осадка) дополнительно измеряют во всех экспериментальных точках равновесные активности (концентрации) одного из независимых компонентов (обычно по данным рН-метрии оценивают активность ионов водорода а(Н
+) = 10-рН. При такой постановке эксперимента общие концентрации t(H+) не контролируют и в программу не вводят, а вместо столбца t(H+) на листе Total Concentrations записывают столбец величин а(Н+), выделяя их красным цветом.Размещают матрицу статистических весов. Номера строк соответствуют номерам изученных смесей k, k =1, 2, ..., N, а номера столбцов – номерам аналитических позиций ll, l = 1, 2, ..., L . Статистические веса задает пользователь на основе принятой модели погрешностей экспериментальных данных, обращаясь, в случае необходимости, к средствам Excel для работы с формулами.
ty FactorsНа листе Intensity Factors записывают факторы интенсивности. Номера строк (i) соответствуют номерам химических форм в стехиометрической матрице, i = 1, 2, ..., S, а номера столбцов – номерам аналитических позиций
ll, l = 1, 2, ..., L. Факторы интенсивности, подлежащие расчету, выделяют красным цветом. Если по данным предварительных исследований остался неизвестным фактор интенсивности реагента Li хотя бы для одной из L аналитических позиций, программа CLINP 2.1 требует вычисления факторов интенсивности этого реагента для всех аналитических позиций. Ситуация, в которой реагенту Li для некоторых позиций приписаны точно известные факторы интенсивности, а для других позиций требуется выполнить расчет, недопустима.Листы Volume Ratios и Phase Pointers
Заполняются только в том случае, если изучалось распределение реагента между фазами.
На листе Volume Ratios формируется содержащий N значений столбец отношений объемов фаз VII / VI, если обе фазы жидкие, или отношений массы фазы II (сорбента) mII к объему фазы I mII / VI в противном случае.
На листе Phase Pointers записывают столбец из S величин. Элементы столбца принимают значение 1, если реагент находится в фазе I, и значение 2, если он принадлежит фазе II.
Запуск программы осуществляется нажатием клавиш CTRL+R
В окне Running содержится информация о ходе вычислений:
Status |
Runnning (Success) |
Method |
Newton (Gauss-Newton) |
Per Cent of Outliers |
Заданное значение процента грубых промахов d |
Iteration on Scale |
Номер итерации по параметру s |
Criterion Function |
Величина минимизируемой функции |
Relative Gradient |
Значение относительного градиента |
Scale’s Parameter |
Значение масштабного параметра s |
Iteration |
Номер итерации по уточнению LK u при фиксированном значении s |
Criterion Function |
Величина минимизируемой функции |
Relative Gradient |
Значение относительного градиента |
Как о результате своей работы программа сообщает о
В качестве глобальных критериев адекватности используются средняя взвешенная невязка (для адекватной модели близка к 0.8), среднее значение модулей невязок (для адекватной модели близко к нулю), остаточная дисперсия s
02 и модифицированная (робастная) статистика c2.Листинг результатов начинается с сообщения о том, по какому критерию прекращены расчеты.
Далее под текстом Logarithms of Constants расположены значения логарифмов констант устойчивости и рассчитанных параметров LKu (последние выделены красным цветом).
Приводится матрица дисперсий-ковариаций параметров LKu..
После заголовка
Intensity Factors следуют факторы интенсивности реагентов, причем рассчитанные значения факторов интенсивности выделены красным цветом.Текст
Weighted Discrepancies предшествует матрице взвешенных невязок, содержащей величины x =w1/2Ч D , где D = Авычислено - Аэксперимент . Синим цветом выделена x с наименьшим абсолютным значением, а красным – x с наибольшим абсолютным значением.Для каждой смеси, для каждой аналитической позиции и для всего массива взвешенных невязок выводятся средние значения невязок (
mean residual) и средние значения модулей невязок (residual mean).Приводятся величины остаточной дисперсии (
residual variance) и ее оценки s2, полученной при вычислении масштабного параметра s по схеме Хьюбера (Huber variance).Рассчитываются статистики, необходимые для проверки адекватности модели: асимметрия (
Skewness), эксцесс (Curtosis), найденное робастное значение статистики c2 (Robust Person's Chi-square observed) и 5 %-ная точка распределения c2 для числа степеней свободы f.Далее приводятся множественные (
Multiple), частные (Partial) и общие (Total) коэффициенты корреляции параметров LKu.Выводятся
результаты сингулярного разложения матрицы Якоби производныхJ = ¶ A / ¶ q : сингулярные числа ki и матрица V.
Под текстом Equlibrium concentrations, mole/l приводятся рассчитанные равновесные концентрации всех реагентов во всех экспериментальных точках (для двухфазной системы концентрации химических форм в фазе II пересчитаны на объем фазы I). Синим цветом выделяются концентрации преобладающих компонентов.
Перекрестная оценка достоверности (Cross-Validation)
Для изучения адекватности моделей все шире применяется метод перекрестной оценки достоверности (кросс-валидация, cross-validation) [Stone M. // J. of the Royal Statistical Soc. – 1974. – V. 36, № 2. – P. 111-147].
В простейшем варианте кросс-оценивания множество N экспериментальных точек делят на два подмножества. Одно содержит (N-1) точек и является основой для расчета параметров LKu и <ali>, другое, содержащее одну точку с номером g, используется для оценки достоверности модели. Для g-й точки при всех аналитических позициях находят невязки
,
где величины, отмеченные шляпкой, рассчитывают для условий эксперимента в g-й экспериментальной точке при значениях параметров, найденных по остальным измерениям. Эту процедуру повторяют для всех N возможных разбиений множества экспериментальных точек и рассчитывают
.
Эта величина измеряет предсказательную способность модели, в отличие от обычной взвешенной суммы квадратов, оценивающей подгоночную способность модели. Близость к единице дисперсии кросс-оценивания
служит сильным аргументом для принятия модели.
На листе Cross Validation для каждой экспериментальной точки записываются невязки d
lg и соответствующие величины искомых параметров LKu (вычисленные при отбрасывании из обрабатываемого массива g-й точки); приводится дисперсия кросс-оценивания. Вернуться к оглавлениюК описанию расчетных процедур и способов проверки адекватности модели