Este trabajo presenta un nuevo método de integración temporal puramente explícito que es estable para grandes pasos de tiempo. El mismo no requiere inversión de matrices ni resolución de un sistema de ecuaciones y por lo tanto es apto para ser paralelizado fácilmente y con alta eficiencia. En este primer trabajo se aplicará la teoría propuesta para resolver problemas de transmisión del calor por conducción, demostrando que es estable para cualquier paso de tiempo como ocurre con los métodos implícitos pero con un costo computacional mucho menor.
We present a novel fully explicit time integration method that remains stable for large time steps, requires neither matrix inversions nor solving a system of equations and therefore allows for nearly effort-less parallelization. In this first paper the proposed approach is applied to solve conduction heat transfer problems, showing that it is stable for any time step as is the case with implicit methods but with a much lower computation time.
El análisis de la transmisión de calor no estacionaria presenta un indudable interés práctico no solamente debido a la importancia que los procesos de enfriamiento y calentamiento poseen en un gran número de aplicaciones industriales, sino también por su similitud con un sinnúmero de otras ecuaciones de la física-matemática que presentan las mismas dificultades para ser resueltas numéricamente. Entre los problemas relacionados directamente a problemas de transmisión del calor no estacionaria cabe citar, por ejemplo, la problemática asociada con el arranque y parada de máquinas, procesos que pueden conllevar, por un lado, la aparición de importantes cargas térmicas en el sólido con el consiguiente deterioro (álabes de turbinas, por ejemplo), y por otro lado, una mayor emisión de especies contaminantes (generadores de vapor, turbinas de gas, motores alternativos de combustión interna, etc.). Entre las ecuaciones diferenciales que tienen la misma problemática para ser resueltas numéricamente, se pueden citar las ecuaciones de conservación de momento, tanto en sólidos como en fluidos, donde en las mismas aparecen términos en derivadas parciales en el espacio de segundo orden y temporales de primer orden.
Por los motivos mencionados anteriormente, la resolución eficiente y precisa de las ecuaciones temporales de transmisión del calor, juega un papel fundamental, no solo por la cantidad de problemas ingenieriles que ellas representan, sino también como caso inicial o de prueba para un número importante de otros problemas más complejos, en particular las ecuaciones de la mecánica de fluidos, cuya solución correcta depende de la eficiencia mostrada por los diferentes métodos en la resolución de las ecuaciones de transmisión del calor [1].
La integración temporal numérica de las ecuaciones se puede hacer en forma explícita o implícita. En la primera, su principal ventaja es la posibilidad de resolver cada paso de tiempo en forma local, sin necesidad de resolver un sistema de ecuaciones donde se involucran la totalidad de los grados de libertad. Su desventaja es la estabilidad condicional de sus resultados lo que en muchos casos conlleva a pasos de tiempo demasiados pequeños para ser eficientes. Por el contrario, los métodos implícitos permiten, bajo ciertas condiciones, pasos de tiempo siempre estables, cuyo tamaño debe ser regulado solo por criterios de precisión y no de estabilidad. A cambio, se debe resolver un sistema de ecuaciones que involucra a la totalidad de sus grados de libertad, lo cual hace que el método sea costoso y de difícil paralelización.
El creciente uso de ordenadores basados en multiprocesadores, ya sea usando programación en paralelo o GPU, ha incentivado últimamente el uso de los métodos explícitos, muchos mas aptos a ser paralelizados debido a su condición de tratamiento local de la información [2]. Podríamos decir que un método explícito, aunque sea mas caro que un método implícito usando un ordenador serial, tiene muchas mas posibilidades de ser más eficiente en un ordenador paralelo, incluso es muy posible que siempre lo llegue a superar, dependiendo de la cantidad de procesadores en paralelo que se use [3].
Este trabajo trata de cómo desarrollar métodos explícitos que sean estables para pasos de tiempo mucho mayores que los normalmente utilizados en este tipo de integración temporal. Los pasos de tiempo que se logran son, para una precisión similar, del mismo orden que los utilizados en los métodos implícitos. De esta forma se mantienen todas las ventajas referentes a la facilidad del tratamiento paralelo propio de los explícitos con las ventajas de los implícitos referentes a su estabilidad para grandes pasos de tiempo.
En este trabajo nos concentramos en el problema de conducción pura, aunque en la Sección 4, se plantea como generalizarlo para problemas de conducción con convección.
2Ecuaciones a resolver y su integración temporalLas ecuaciones de transmisión del calor en un medio que se mueve con una velocidad conocida V(x,t) se las puede escribir como:
donderepresentan, la posición de una partícula en el espacio en función del tiempo, la temperatura, el campo conocido de velocidad del material, una fuente externa de calor, el coeficiente de conductividad térmica y el coeficiente de capacidad calorífica. El término Dφ/Dt representa la derivada material de cualquier función ϕ, T¯ representa la temperatura impuesta en los contornos ΓD donde hay condiciones de Dirichlet y q¯n el flujo térmico en los contornos ΓN donde hay condiciones de NeummanLa ecuación (2.1) está escrita en forma Lagrangiana. Su forma Euleriana se obtiene reemplazando la derivada material por la derivada espacial más el término convectivo (Dφ/Dt)=∂φ/∂t+V ∇φ.
La integración temporal de primer orden estándar de la ecuación anterior entre 2 instantes de tiempo tny tn+1=tn+Δt es:
donde el coeficiente θ puede variar entre 0 y 1. Para θ=0, el método es explícito y para θ≠0 el método es implícito.Para θ<1/2 el método es condicionalmente estable. En particular para el caso explícito (θ=0), los límites de estabilidad vienen dados por 2 coeficientes adimensionales, el número de Courant Co=VΔt2δ y el numero de Fourier Fo=κCΔtδ2.
El parámetro δ representa el tamaño mínimo en el que se puede aproximar la variación de la función incógnita (en nuestro caso la temperatura) en la discretización. Por ejemplo, en un problema unidimensional, δ representa la menor distancia entre 2 nodos, pero en un problema tridimensional discretizado con tetraedros, δ es la menor altura de todos los tetraedros.
El límite de estabilidad para el caso explícito viene dado por (Co+Fo)≤12.
En un trabajo anterior [4] los autores explicaron la forma de resolver problemas con grandes pasos de tiempo utilizando una integración temporal explícita para los casos dominados por convección (grandes números de Courant y pequeños números de Fourier). Por este motivo en este trabajo solo se tratará el caso dominado por difusión (Co=0), enviando al lector interesado a la referencia [4] para los casos dominados por convección. En la mencionada referencia, la integración explícita para obtener métodos estables para cualquier paso de tiempo en el caso dominado por convección, se la denominó integración X-IVAS. Será repasada en este trabajo para facilidad del lector. En el capítulo cuarto introduciremos nuestra propuesta para combinar ambas metodologías para tratar problemas de conducción-convección, integrados temporalmente en forma explícita, estables y con grandes pasos de tiempo.
3Caso con conducción sin convecciónDefiniremos la función aceleración o tasa de crecimiento térmico g(x, t)=gt(x) como:
Para aumentar la estabilidad de la solución explícita, el cálculo de la función gt(x) en cualquier punto xi del espacio lo calcularemos aplicando el siguiente kernel:
donde φ(x) es una función de peso arbitraria pero que cumple al menos que:En la ecuación (3.3), Rball representa el radio del volumen Ω que tiene relación con la distancia R* hasta donde llega la información suponiendo que la misma se desplaza en forma radial con una velocidad ficticia V*:
Para lograr integraciones explicitas estables, el radio R* debe ser:
Por tanto
donde hemos definido un número de Fourier ficticio como Fo*=κCΔtR*2En la Sección 5 de este artículo desarrollaremos la teoría sobre la condición de estabilidad (3.5) o (3.6) y la relación existente entre Rball y R*.
Entonces, la integración temporal explicita que en la forma estándar es:
queda ahora usando la aproximación (3.2):
Existen en la literatura otras propuestas para ampliar el límite de estabilidad de la integración explícita [5–8]. Por ejemplo en la referencia [5], se propone hacer pasar un polinomio de grado M en cada punto a integrar y se toman tantos puntos en su vecindad como los necesarios para definir biunívocamente un polinomio de grado M. El método solo se lo utiliza para casos con distribución de puntos regulares dado el costo computacional que significaría utilizarlo para distribuciones arbitrarias de nodos. En una forma mucho más elemental la referencia [6] propone simplemente usar para la definición de la derivada segunda, puntos más alejados que los vecinos. Lógicamente solo se presentan ejemplos unidimensionales debido a la imposibilidad de generalizar esta metodología a espacios mayores. La propuesta realizada en este trabajo es aplicable a problemas tanto en 1, 2 como en 3-dimensiones y con distribuciones arbitrarias de nodos, como se podrá apreciar en los ejemplos realizados.
3.1Dizcretización espacialUtilizaremos para la discretización espacial de la temperatura el método de los elementos finitos (FEM):
donde el vector N(x) representa las clásicas funciones de forma del FEM y el vector T los valores locales de temperatura en los nodos de la malla.De igual forma, para el cálculo de la integrales dentro de (3.8), aproximaremos la función que recién denomináramos como aceleración ∇κC∇Tn(x)+Qn(x)C por una función continua con las mismas funciones de forma que las usadas para la temperatura:
El valor de gn(x) lo obtenemos planteando la ecuación en residuos ponderados:
que luego de integrar por partes el primer termino queda:
o en forma matricial:o sea:donde:Por lo tanto la expresión final para evaluar en forma explícita el valor de la temperatura en el tiempo n+1 queda:
3.2Evaluación de las integrales espacialesAmbas integrales espaciales en (3.16) se las pueden calcular de diversas maneras, ya sea en forma analítica o numérica. Evidentemente, el costo computacional del método propuesto dependerá de la eficiencia en calcular dichas integrales. En este trabajo proponemos hacerlo en una forma numérica muy sencilla que tiene la ventaja de ser muy eficiente desde el punto de vista computacional. Para esto subdividimos el dominio Ω en varios subdominios δΩ de forma que:
donde xl son los diferentes puntos de integración.Si consideramos como puntos de integración los mismos nodos de la malla, para cada nodo podemos definir una integral:
Ahora los xj de la ecuación 3.18 son los propios nodos de la malla que están dentro del espacio donde ϕi≠0.
Sea ML la matriz agrupada (del inglés lumped) de la matriz M. Teniendo en cuenta que cada uno de sus términos diagonales es el volumen asociado a cada nodo δΩi=MiiL, entonces:
donde ΦiT=[ϕi(x1),ϕi(x2),ϕi(x3),...ϕi(xi),...ϕi(xm)].Entonces (3.16) se puede escribir como:
en donde hemos agrupado dentro de la matriz ΦT los diferentes vectores ΦiT divididos por su correspondiente γiPara el caso en que se utilizan matrices de masa agrupada (aproximación estándar en los métodos explícitos), el algoritmo a resolver queda simplemente:
Como resumen el método explicito estándar es:
y el nuevo método estabilizado para grandes pasos de tiempo queda:Es de hacer notar que la matriz Φ depende exclusivamente de la malla y del radio r elegido para las funciones ϕi. Mientras se cumpla la Ecuación 3.6, la resolución será estable.
3.3Condiciones de contornoSupondremos 2 tipos de condiciones de contorno:
- -
ΓT, contorno donde se conoce la temperatura T¯(xΓT) y donde supondremos que la misma no varía en el tiempo DTDtΓT=0.
- -
Γq, contorno adiabático ∇T(xΓq) n(xΓq)=0
Esta última es la condición natural, por lo tanto en las fronteras donde no se impone nada, serán consideradas fronteras adiabáticas.
Como es estándar en FEM en el contorno ΓT las funciones de forma N(xΓT) de aproximación de la temperatura son nulas, pero como además aquí estamos representando también la función aceleración si esta condición de contorno no cambia en el tiempo entonces hay que imponer también las funciones de forma N(xΓT) de aproximación de la DTDtΓT a un valor nulo. En forma equivalente se puede hacer cero los valores de gn calculados en los nodos pertenecientes a esas fronteras.
4Caso con conducción y convecciónSi bien en este artículo no se mostrarán ejemplos del caso combinado de problemas de conducción-convección resueltos en forma explicita, se presenta a continuación una propuesta de cómo resolverlo. Utilizaremos una modificación del método X-IVAS propuesto en [4].
El método X-IVAS consiste en integrar temporalmente dentro de cada paso de tiempo la posición de las partículas de material siguiendo las líneas de corriente:
Este método tiene la ventaja que es explícito y estable para Fo≤1/2 independientemente del número de Courant. A continuación propondremos una modificación del método X-IVAS, basada en la forma de integrar desarrollada en la sección 3, para salvar también el inconveniente de la necesidad de mantener el paso de tiempo suficientemente pequeño y poder lograr un método de integración explícito con Co>1 y Fo>1/2.
Si llamamos g⌢n al vector de aceleraciones modificado según (3.20)
entonces el método descrito anteriormente para conducción pura se escribirá:Cuando también exista convección, la aplicación de X-IVAS a este esquema queda:
Es de hacer notar que la matriz Φ se la puede calcular una sola vez antes de empezar la integración. Lo mismo la matriz K, si los coeficientes κ/C no cambian con el tiempo.
Por tanto la evaluación del vector g⌢n es explicita y se puede hacer antes de comenzar cada paso de tiempo. Por último la evaluación de Tn+1(xn+1) de cualquier partícula por separado, se la puede calcular integrando las funciones de forma ∫nn+1NT(xτ)dτ y las velocidades ∫nn+tVn(xτ)dτ para lo cual se pueden utilizar métodos numéricos (dividiendo el paso de tiempo Δt en varios sub pasos δt=Δt/nsubpasos o realizando una integración analítica [9,10].
Por último es conveniente remarcar que por tratarse de una formulación Lagrangiana y al haber convección, la posición xn+1 de cualquier partícula no es la misma que la posición en xn. Por tanto, el método se puede utilizar en una formulación con malla móvil, moviendo los nodos de la malla a cada paso de tiempo de xn a xn+1, o en una formulación con malla fija, previa proyección de las temperaturas sobre los nodos de la malla Ref [9,10].
5Consistencia y condiciones de estabilidad5.1Análisis de la consistenciaUna de las primeras ideas fue verificar que el método desarrollado fuera de primer orden en el tiempo y segundo orden en el espacio como lo es el esquema centrado en el espacio y explícito en el tiempo denominado comúnmente Forward Euler, en adelante, el método estándar. Recordemos que el método explícito estándar tiene como ecuación discreta en el caso unidimensional la siguiente expresión, que para mallas regulares coincide con el método de las diferencias finitas:
5.2Si desarrollamos por Taylor el esténcil anterior usandoy reemplazando en la anterior vemos queUtilizando la ecuación del continuo se establece que el esquema es consistente (la diferencia entre la ecuación a resolver y la versión discreta de la misma va a cero cuando ambos pasos discretos, el del tiempo y el de la malla tienden a cero) y nos queda que el error del método depende linealmente con el paso de tiempo y cuadráticamente con el espaciamiento de la malla.
Del mismo modo se puede analizar la consistencia del esquema explícito modificado. En ese caso hemos usado un polinomio φ(r), o función de peso, definido como:
con xi la coordenada del nodo i en cuestión y Rball un radio de influencia que marca aproximadamente el semi-ancho del esténcil. Siendo que el esquema modificado se escribe como:Como el cómputo es tedioso de hacerlo en forma manual se recurrió a un análisis simbólico del cual, escribiendo la ecuación que queda después de reemplazar cada término por su correspondiente expansión de Taylor surgió lo siguiente:
de lo cual para poder demostrar que el esquema es consistente se debe cumplir que β0≅0 y β2≅1.Para el caso de N=2 surgió lo siguiente:
Para el caso de N=3 surgió lo siguiente:
Finalmente para el caso de N=4 tenemos:
Por todo lo mostrado podemos asegurar que el esquema modificado goza de ser consistente.
5.3Análisis de estabilidadA continuación planteamos un análisis de estabilidad para el problema 1D. Para ello utilizamos el esténcil que genera el método explícito aquí presentado, a saber:
Por cuestiones de simplicidad hemos asumido que la malla es de tamaño constante motivo por el cual hemos obviado en la expresión anterior tanto en el numerador como en el denominador el tamaño de la misma. Reemplazando la expresión de la función gn para el caso de un esténcil 1D de conducción pura con paso de malla constante por:
Usando la definición del número de Fourier (5.8) queda:
que podemos reescribir como:Si tomamos por ejemplo un radio de integración de 3Δx obtenemos la función de ponderación φ graficada en la figura 1. Se puede apreciar que se anula en los extremos del esténcil ϕr=1=0 por lo que las gn(xi±3) no son necesarias.
Utilizando el método de integración propuesto la temperatura en un nodo i para el paso de tiempo n+1 toma la siguiente forma:
Considerando ahora la evolución de un único modo de Fourier para la onda k, podemos expresar la temperatura como:
Utilizando la definición cos(kh)=1/2(eikh+e−ikh) en la ecuación 5.11 obtenemos:
con
donde A es un factor de amplificación y para que el sistema sea estable su valor absoluto debe ser menor a 1 para todas las ondas.Usando ahora la identidad trigonométrica [1-cos(x)]=2sin2(x/2), la fórmula 5.13 se convierte en:
Buscando el valor de la fase kh que maximice los términos multiplicados por (Fo/γ) podemos encontrar el límite de estabilidad. Además esto nos permite determinar la longitud de la onda que causa la divergencia. Esta tarea se realizó utilizando Matlab [11] para diferentes radios de integración. Los valores obtenidos mediante este análisis y los Δtcríticos para una malla de 2000 elementos con κ/C=1 se pueden observar en la tabla 1.
Δtcrít obtenidos mediante diferentes evaluaciones
Rball | Δtcrít obtenido mediante el análisis de V. Neumann | Δtcrít obtenido en los experim. numéricos | Δtcrit=12(R*)2κ/C | Norma L2 error | Tiempo de ejecución [s] |
<1 | 0,500 | 0,50 | 0,50 | 3,82E-04 | 37,69 |
2 | 1,333 | 1,33 | 1,12 | 4,59 E-04 | 18,57 |
3 | 2,693 | 2,69 | 2,22 | 5,76 E-04 | 11,34 |
4 | 4,606 | 4,61 | 3,78 | 8,01 E-04 | 7,93 |
5 | 7,069 | 7,07 | 5,78 | 1,10 E-03 | 5,98 |
6 | 10,08 | 10,09 | 8,22 | 1,52 E-03 | 4,79 |
7 | 13,64 | 13,65 | 11,11 | 2,03 E-03 | 4,02 |
8 | 17,75 | 17,77 | 14,44 | 2,41 E-03 | 3,42 |
9 | 22,40 | 22,42 | 18,23 | 3,18 E-03 | 3,02 |
El análisis por Von-Neumann presentado anteriormente resulta adecuado para evaluar la estabilidad del método propuesto y obtener una relación entre el ancho del kernel Rball y el radio R* para el cual se cumple la ecuación 3.5.
Para obtener una fórmula rápida, que permita deducir en forma inmediata el análisis del paso de tiempo crítico en función de la ϕ utilizada se ha realizado el siguiente análisis:
Si la función ϕ es lineal, de forma tal que valga uno para x=0 y cero para x=Rball, entonces es fácil ver que en este caso, la aproximación de g(x) realizada en (3.2) es equivalente a tomar un elemento de tamaño h=Rball. Como es bien sabido, el Δtcrit para un elemento de este tamaño es Δtcrit=Rball22κ/C. Este es el paso máximo de estabilidad para una ϕ de radio Rball. El inconveniente de esta ϕ es que tiene la precisión de un elemento de h=Rball. Si queremos mejorar la precisión, sin disminuir excesivamente el paso de tiempo, se pueden utilizar funciones ϕ que tengan mayor peso en la cercanías de x=0 y menor peso en x=Rball. Si llamamos ϕL a la función lineal podemos establecer la siguiente relación:
Utilizando la función propuesta en (5.5e) integrándola en un dominio unidimensional de radio Rball obtenemos:
Extrapolando el concepto para problemas 3D y tomando como coordenadas del nodo: [0,0,0] la función φL debe cumplir:
por lo que:
Tomando como dominio de integración para la φL el octaedro definido por los puntos dados en 5.17 y una esfera de radio Rball para la φ evaluada finalmente se obtiene el R* para el caso tridimensional como:
Nota: aunque quede fuera del alcance de este trabajo, siguiendo la misma idea anterior, se podrían obtener aproximaciones explícitas de mayores órdenes en el tiempo. Por ejemplo, en vez de pensar en una aceleración gt(x)=gn(x) constante en el tiempo, podemos pensar en una aceleración linealmente variable en el tiempo:
Y por tanto, el método explícito modificado de segundo orden en el tiempo nos queda (Adams–Bashforth):
6Ejemplos numéricos6.1Ejemplo 1DPara verificar la consistencia del método propuesto se simuló con Matlab un caso de malla homogénea con Δx=1 y κ/C=1, con 2.000 nodos. Las condiciones iniciales de temperatura fueron dadas por una función Gaussiana. Dado que se conoce la solución analítica para este problema se computó la norma de error L2 para cada paso de tiempo y se guardó su valor más alto siempre y cuando la temperatura en los contornos se mantenga cercana a cero. Los resultados se pueden apreciar en la tabla 1. El tiempo de ejecución es para 100.000 segundos de simulación.
Observando los resultados obtenidos podemos concluir que:
- •
el costo del método modificado decrece linealmente con el ancho del esténcil empleado.
- •
esto se explica porque si bien el cálculo es más costoso, el paso de tiempo empleado crece más que linealmente con el ancho del esténcil, diríamos que cuadráticamente, con lo cual el costo final se reduce linealmente. Esto quiere decir que si se utiliza un esténcil de semi-ancho 4, el nodo en cuestión interactúa con 4 vecinos a cada lado, el costo se reduce 4 veces en una malla homogénea.
- •
la precisión cae al aumentar el radio de integración.
- •
comparando la columna 2 con la columna 3 se aprecia que el análisis por von Neumann resulta adecuado para evaluar la estabilidad del método propuesto.
- •
en la columna 4 de la tabla 1 se observa los valores de Δtcrít obtenidos con la aproximación propuesta en (5.15) son aceptables y se puede ver que son conservativos.
La generación de una malla 3D por medio de elementos finitos de forma de tetraedros es, posiblemente, la mas utilizada para resolver problemas prácticos. Sin embargo, hasta ahora ha resultado muy difícil obtener mallas de tetraedros que sean luego eficientes para obtener soluciones utilizando métodos explícitos. El motivo es que es casi imposible que toda la malla tenga elementos tetraédricos regulares. Efectivamente, la mejor de las mallas 3D tetraédricas, luego de aplicarle algún algoritmo de eliminación de los slivers (tetraedro achatado con volumen casi 0), presentan algunos elementos con un espesor δ que, en el mejor de los casos son del orden h/10, siendo h el espaciamiento promedio entre los nodos de la malla [12]. Como el número de Fourier necesario para la estabilidad de los métodos de integración explícitos depende de δ2, esto hace que para una malla de tamaño h, para la cual uno espera un límite de integración estable para
obtenga estabilidad solo para
Por este motivo la utilización de un método explicito estándar resulta prohibitivo en la mayoría de los casos. Como veremos en los ejemplos 3D, la modificación propuesta en este artículo permite salvar este inconveniente y obtener pasos de tiempos proporcionales a h2 (en vez de ser proporcionales a δ2). Incluso se pueden obtener pasos de tiempo mayores al correspondiente al Fourier de la malla a precisiones de cálculo muy aceptables.
Las versiones del código en 2 y 3 dimensiones fueron desarrolladas dentro del ambiente de KRATOS [14]. De esta manera se evitó programar las tareas comunes de todos los programas de elementos finitos.
6.2.1Prisma con malla homogénea y campana de Gauss de temperatura en su interiorSe trata de un prisma de dimensiones 50x50x10 con una malla de tetraedros con una distancia entre nodos más o menos constante igual a h=1/3, con κ/C=0.95 y con contornos adiabáticos. En el interior se introduce un campo de temperaturas inicial en forma de una campana de Gauss radial que se deja difundir en el tiempo (ver figura 2). La solución analítica del problema para un dominio de dimensiones infinitas se obtiene mediante la fórmula 6.3. Se tomó como tiempo inicial t=5 y se dejó difundir hasta t=55, de forma tal que los límites del dominio no alteren la solución. (Es decir que la temperatura no ha sido sensiblemente modificada en los contornos).
El ejemplo fue procesado usando 3 métodos, a) un método explicito estándar con el máximo paso de tiempo posible para que sea estable, b) usando un método implícito con θ=1/2 para varios pasos de tiempo diferentes y c) con el método explicito modificado presentado en este artículo para distintos valores del paso de tiempo y usando la función de ponderación definida en (5.5):
donde Rball es el radio de integración y d la distancia al nodo central.La malla utilizada fue de 500.000 tetraedros con una distribución uniforme. La misma fue generada con GID [13]. A pesar de tener una distribución de nodos aproximadamente constante, la malla tiene algunos elementos distorsionados (con ángulos diedros menores a 10°). Aún así es considerada una buena malla para un dominio 3D.
La tabla 2 muestra los resultados obtenidos con los distintos métodos. La columna 1 muestra los radios de integración empleados. La segunda columna el paso de tiempo utilizado. En la tercera y cuarta columna aparecen el error y el tiempo de cálculo para el método explícito modificado (MEM) presentado en este trabajo y en las columnas quinta y sexta los mismos valores para un método implícito (MI) con θ=1/2. Para cuantificar la exactitud se calculó la norma de error L2 en el dominio para cada paso de tiempo y se retuvo el valor máximo. Errores por debajo de 10–04 son errores de la discretización espacial para esa malla y por lo tanto no deben tenerse en cuenta para el análisis del error de la integración temporal.
Prisma con h=1/3 constante. Resultados para diferentes Δt
r | Δt | error MEM | tejec MEM | error MI | tejec MI |
0,013 | 1,142E-04 | 356 | 1,14E-04 | 1.430 | |
0,635 | 0,055 | 1,136E-04 | 94 | 1,14E-04 | 358 |
1,154 | 0,26 | 1,161E-04 | 19,72 | 1,49E-04 | 90 |
1,732 | 1,0 | 5,052E-04 | 5,85 | 2,31E-04 | 30 |
2,309 | 1,95 | 1,723E-03 | 3,61 | 9,77E-04 | 18 |
2,887 | 2,95 | 6,701E-03 | 3,25 | 1,48E-03 | 14 |
El máximo paso de tiempo (Δt) estable para el caso explícito estándar fue de 0,013 segundos. Este valor es coherente para la malla descripta anteriormente con esos valores de tetraedros deformados.
Se calcularon usando el método implícito y el método explicito modificado pasos de tiempo sucesivamente cada vez más grandes hasta llegar a pasos de tiempo casi 200 veces mas grandes y se analizó para cada caso, el tiempo total de cálculo para los 55 segundos de tiempo de simulación y la precisión alcanzada. Es de hacer notar que todos los cálculos se hicieron en una maquina serial, por tanto se supone que en caso de paralelización, el método explícito debería tener una performance mucho mayor que el método implícito.
En los resultados de la tabla 2 se pueden observar las siguientes características:
- 1
Para el método explícito modificado (MEM) propuesto en este artículo, la solución fue siempre estable, aun para pasos de tiempo casi 200 veces mayores que el paso límite de estabilidad para el explícito estándar (caso con r < h).
- 2
El tiempo total de cálculo, a igualdad de paso de tiempo, es siempre menor en el MEM que en el método implícito (MI). Esto es menos de 4 segundos para el MEM contra más de 14 s para el MI en el caso del máximo paso de tiempo estudiado.
- 3
A igualdad de paso de tiempo, la precisión del MI es mas alta que el MEM. No obstante los resultados en cuanto a precisión del MEM son razonables y perfectamente aceptables para los límites normales de precisión en cálculos ingenieriles.
- 4
Comparado con el método explícito estandar, la modificación propuesta permite un método explícito con pasos de tiempo 200 veces más grandes en una malla 3D con una distribución de nodos regular.
- 5
El paso de tiempo estable del método explícito estándar se haría aun más pequeño en caso de que la malla tenga muchos elementos defectuosos. Para el MEM los elementos defectuosos no modifican el paso de tiempo estable si se utiliza un radio de integración suficiente grande, como se explica en el punto siguiente.
- 6
La aproximación numérica de las integrales de ϕ y gn propuesta en (3.18) son válidas para mallas regulares sin elementos distorsionados. En el caso de mallas irregulares, con grandes variaciones de la distancia entre nodos o en el caso de mallas regulares, pero con elementos distorsionados, la aproximación (3.18) deja de ser una integración sobre un radio constante Rball para pasar a ser una integración sobre un dominio irregular con un radio muy variable dependiendo de la distorsión de los elementos. Por este motivo, la ecuación (3.6) que demuestra ser apropiada para problemas 1D y 2D con mallas regulares, se puede interpretar como imprecisa para mallas 3D en presencia de elementos distorsionados. Esta imprecisión es menor a medida que aumentamos el radio de integración. El motivo es que para radios pequeños (de tamaño h o 2h) se toman pocos nodos de la vecindad del nodo xi y por lo tanto la influencia de los elementos distorsionados es grande. Para radios grandes la influencia de los elementos distorsionados se hace menos sensible ya que se comportan como macro-elementos generados por la nube de nodos dentro del radio de integración. Este comportamiento se puede apreciar en la figura 3 donde se ha trazado el Δt estimado en una malla no distorsionada frente al Δt realmente obtenido para la malla 3D en estudio.
- 7
En la figura 4 se puede observar que para obtener un error máximo determinado independientemente del Δt, el MEM siempre resuelve el problema para todo el intervalo en menos tiempo.
Para evaluar la capacidad del MEM de resolver problemas que poseen mallas de h no constante, se remalló el dominio del problema anterior utilizando 2 tamaños diferentes como se aprecia en la figura 5. Con esto se busca captar con mayor precisión la zona donde el gradiente de temperatura es más elevado.
La tabla 3 muestra los resultados obtenidos para diferentes Δt por diferentes métodos.
Prisma con h variable. Resultados para diferentes Δt por distintos métodos
r | dt | tejec MEM | error MEM | tejec MI | error MI |
< h1 | 0,0032 | 1441 | 9,256E-05 | 21.616 | 9,241E-05 |
0,36 | 0,0067 | 711 | 1,471E-04 | 10.098 | 9,241E-05 |
0,6 | 0,021 | 231 | 2,879E-04 | 2.891 | 9,243E-05 |
0,9 | 0,033 | 194 | 6,284E-04 | 1.721 | 9,972E-05 |
1,2 | 0,072 | 113 | 9,078E-04 | 676 | 1,130E-04 |
1,5 | 0,15 | 68,1 | 9,617E-04 | 322 | 1,153E-04 |
1,8 | 0,29 | 52,7 | 1,038E-03 | 190 | 1,693E-04 |
2,1 | 0,51 | 41,1 | 1,656E-03 | 128 | 1,837E-04 |
2,4 | 0,82 | 34,9 | 2,215E-03 | 95 | 2,338E-04 |
2,7 | 1,25 | 30,1 | 3,148E-03 | 68 | 5,391E-04 |
Al igual que en la tabla 2, la primera fila corresponde al caso explicito estándar (r<0), que para este ejemplo tiene un Δt máximo de estabilidad de 0,0032 s y tarda en analizar los primeros 55 s 1.441 s de cálculo.
La primer columna muestra los diferentes radios de integración utilizados y la columna 2 los diferentes pasos de tiempo estables para ese radio de integración. Se puede apreciar que se logran pasos de tiempo hasta 390 veces más grandes que el límite de estabilidad estándar con una ganancia en el tiempo total de cálculo de 47 veces. El error se deteriora, pero se mantiene siempre dentro de los límites ingenieriles aceptables. Los resultados del método implícito (MI) en las columnas 5 y 6 de la tabla, muestran que MI da siempre errores inferiores a los errores espaciales, pero con tiempos de cálculo siempre superiores a los obtenidos con MEM.
En este problema es interesante observar que para obtener un mismo Δt se debieron utilizar radios de integración mayores que en el caso anterior de h=constante. Esto se debe a que en la zona donde la malla es más gruesa (h2=0,9) el coeficiente entre el radio de integración y h es más bajo (ver figura 3) y por lo tanto la integración pierde precisión, como se explicó en el punto 6 del apartado anterior.
6.2.3Cubos con salto brusco del coeficiente de conductividad en su interiorCon este ejemplo (ver figura 6) se buscó determinar la degradación de la solución debido a saltos bruscos en el coeficiente de conductividad entre un elemento y otro El modelo son 2 cubos contiguos de 1x1x1 con una malla de h=0,07. El primero con un κ/C=1,0 y el segundo de κ/C=0,1. Se fijan como condiciones de contorno T=1 en un extremo y T=0 en el otro. El resto de las caras se consideran adiabáticas.
Por analogía eléctrica la temperatura en la sección central debe ser de 1/1,1= 0,909 y hacia ambos lados variar con un gradiente constante hasta llegar a la temperatura de los contornos. La figura 7 muestra los resultados obtenidos con el MEM y el MI, usando en ambos casos un Δt=0,0147 y r=5h en el MEM. Es de hacer notar que Δt=0,0147 corresponde a un paso de tiempo 100 veces mayor que el Δt estable en un método explícito estándar.
El método explicito propuesto en este trabajo, no presentó ninguna variación en cuanto a la estabilidad ya expuesta anteriormente para el caso de mallas regulares. No obstante, al tomar información en un cierto radio, suaviza levemente la transición entre ambos materiales como se puede observar en la figura 7.
6.2.4Cubos con salto brusco de temperatura en su interiorEste ejemplo se utilizó para ver el comportamiento del MEM para casos con grandes gradientes de la función incógnita. La geometría analizada es la misma del ejemplo anterior utilizando ahora un coeficiente de conductividad constante en todo el dominio y condiciones de contorno y condiciones iniciales:
El problema fue resuelto en forma explicita mediante el MEM con un paso de tiempo mucho mayor al límite de estabilidad para el método explícito estándar y los resultados no presentaron ningún tipo de inestabilidad. Para apreciar la precisión del método, el mismo problema fue resuelto en forma implícita (MI). Como es sabido el método implícito con θ=1/2 es incondicionalmente estable. No obstante en este problema con grandes gradientes de temperatura, los métodos implícitos presentan al comienzo del período de tiempo, importantes oscilaciones espurias cuando se utilizan grandes pasos de tiempo. Si bien estas oscilaciones pueden amortiguarse utilizando θ>0,8, esto conlleva a un aumento del error (por acercarnos al menos exacto Backward-Euler) y por lo tanto se necesitaría adaptar este factor en cada problema de forma tal de obtener la mayor precisión posible sin oscilaciones.
La figura 8 muestra la evolución de la temperatura en un nodo que se encuentra en x=1 comparando los 2 métodos utilizando un Δt tal que Fo=5 Además se traza como referencia la solución brindada por el MI utilizando un Δt pequeño (Fo<<1). Se puede apreciar que la convergencia del MEM a la solución estacionaria es más lenta que el MI, pero con la ventaja de no presentar oscilaciones espurias y ser completamente explícito. La fuerte discontinuidad que presenta el problema hace que el método implícito necesite al menos un θ≥0,8 en lugar del valor teórico de θ≥0,5
6.2.5Disipador 3DPor último se calcularon los resultados sobre una aplicación ingenieril del problema de transmisión del calor. Se trata de un modelo de disipador del calor cuyas dimensiones son 10 x 10 x 10 y posee las siguientes propiedades: conductividad κ/C=1.000. El mismo es sometido a una fuente de calor variable en la base, que oscila en intensidad con una función sinusoidal. El dominio incluye además una región con conductividad menor (κ/C=10) como se aprecia en la figura 9. En los contornos de este dominio se fijó la temperatura en T=20°C.
Dado que no se tiene una solución analítica para este problema, se tomaron como resultados de comparación los obtenidos con un método implícito (MI) con un paso de tiempo correspondiente a Fo= 0,07, que es el máximo paso de tiempo estable para el esquema explícito estándar (ME). Se compararon estos resultados con los brindados por el MEM para diferentes radios de integración y con el MI para los mismos Δt. Los tiempos de ejecución para un segundo de simulación y los errores utilizando la norma L2, se pueden ver en la tabla 4. El error indicado en la tabla es el máximo error obtenido en un paso de tiempo durante el intervalo de cálculo.
Disipador 3D. Resultados para diferentes Δt por distintos métodos
r | Δt | Error MEM | tejec MEM | Error MI | tejec MI |
<1 (ME) | 0,0000055 | 3,15E-06 | 8759 | - | - |
2,2 | 0,0000111 | 4,9E-04 | 4530 | 3,65E-06 | 19379 |
3 | 0,000050 | 1,12E-03 | 1101 | 3,26E-05 | 6451 |
4 | 0,000189 | 2,35E-03 | 281 | 1,12E-04 | 2747 |
5 | 0,000444 | 4,03E-03 | 178 | 3,35E-04 | 1684 |
6 | 0,000689 | 6,0E-03 | 160 | 4,5E-04 | 1141 |
Como se aprecia en la tabla 4, con el MEM se obtuvieron errores siempre menores al 1%, requiriendo un tiempo de ejecución total mucho menor al del método explícito estándar utilizando el Δtcrít o el MI utilizando el mismo paso de tiempo. Esta ventaja del MEM en cuanto a tiempo de cálculo sería aún mayor si se sacara provecho del mejor speed-up que gozan los métodos explícitos frente a los implícitos en cuanto a la eficiencia de la paralelización.
7ConclusionesSe ha presentado una modificación a introducir en la integración temporal explícita de las ecuaciones de transmisión del calor por conducción con las siguientes características:
- 1)
Permite obtener soluciones transitorias sin necesidad de invertir ninguna matriz
- 2)
Es estable para pasos de tiempo mucho mayores que los pasos de tiempo usados en los métodos explícitos estándar.
- 3)
Consume mucho menos tiempo de cálculo que un método explícito estándar y a igual tamaño de paso de tiempo también consume menos tiempo de cálculo que un método implícito.
- 4)
Por ser un método explícito es fácil de programar (autómata celulares) en maquinas con múltiples procesadores y por la misma razón se espera una alta eficiencia en la paralelización.
- 5)
Para grandes pasos de tiempo, tiene menos precisión que un método implícito, pero es más eficiente en cuanto a tiempo de cálculo.
- 6)
El método es simple de programar y/o de adaptar a programas existentes.
El método es fundamentalmente útil en problemas 3D donde la utilización de una integración explícita estándar es muy costosa debido a que la estabilidad depende del elemento más distorsionado. Con este método se recupera la posibilidad de regular el paso de tiempo deseado en función del error requerido y no en función de la estabilidad del método.
Sin embargo debe tenerse en cuenta que el tamaño de la matriz Φ aumenta según el cubo del radio de integración, por lo que grandes radios de integración (del orden de 10h o más) tornan al método menos eficiente debido a la cantidad de operaciones que requiere y sobre todo a la memoria requerida para almacenar dicha matriz; a partir de ciertos valores de r el tiempo de cálculo en el MEM es tal que no compensa la ganancia por aumentar el paso de tiempo.
En conjunto con el método X-IVAS propuesto en la referencia [4] permitiría tratar en forma explícita problemas donde hay también convección, sin límites de estabilidad.
Su generalización para la resolución de otras ecuaciones similares como las ecuaciones de Navier-Stokes parece evidente y será probada en futuros trabajos.
Este trabajo fue parcialmente financiado por el Advanced Grant: ERC-2009-AdG Real Time Computational Mechanics Techniques for Multi-Fluid Problems otorgado por la European Research Council. Norberto Nigro desea agradecer al CONICET, la Universidad Nacional del Litoral y a la Agencia Nacional de Promoción Científica y Tecnológica (ANPCyT) por su apoyo económico a través de los proyectos PICT 1645 BID (2008) y CAI+D 65-333 (2009)). Un especial agradecimiento al Dr.Pedro Morín por sus invalorables comentarios en los aspecto matemáticos del método aquí desarrollado.