En este trabajo se exponen un método de elementos de borde en una variante jerárquica y su empleo en flujo de Stokes alrededor de cuerpos rígidos tridimensionales en régimen estacionario. La propuesta se basa en el algoritmo jerárquico de bajo orden descendente y autoadaptativo de Barnes-Hut, que se emplea junto con una formulación integral de contorno indirecta y de segunda clase cuyo término fuente es función de la velocidad no perturbada. El campo solución es la densidad superficial de capa doble modificada para completar el espectro de autovalores del operador integral. De esta manera, los modos rígidos son eliminados y se pueden representar una fuerza y una cupla no nulas sobre el cuerpo. Los elementos son triángulos planos de bajo orden y se emplea una resolución iterativa mediante residuo mínimo generalizado (GMRES) sin precondicionamiento. Los ejemplos numéricos incluyen casos con soluciones analíticas, cuerpos con aristas y vértices o con formas intrincadas. La ventaja principal de la técnica desarrollada se halla en la posibilidad de considerar un número de grados de libertad mayor respecto a los que pueden emplearse con los métodos de colocación al centroide más tradicionales, debido a la disminución de la demanda de memoria primaria y de los tiempos de cómputo.
In this work, a hierarchical variant of a boundary element method and its use in Stokes flow around three-dimensional rigid bodies in steady regime is presented. The proposal is based on the descending hierarchical low-order and self-adaptive algorithm of Barnes-Hut, and it is used in conjunction with an indirect boundary integral formulation of second class, whose source term is a function of the undisturbed velocity. The solution field is the double layer surface density, which is modified in order to complete the eigenvalue spectrum of the integral operator. In this way, the rigid modes are eliminated and both a non-zero force and a non-null torque on the body could be calculated. The elements are low order flat triangles, and an iterative solution by generalized minimal residual (GMRES) is used. Numerical examples include cases with analytical solutions, bodies with edges and vertices, or with intricate shapes. The main advantage of the presented technique is the possibility of considering a greater number of degrees of freedom regarding traditional collocation methods, due to the decreased demand of main memory and the reduction in the computation times.
Es conocido que en el método de elementos de borde (BEM, por Boundary Element Method[1]) o de paneles [2,3], en sus formas más clásicas, los elementos interactúan todos contra todos. Por otra parte, en los métodos numéricos relacionados con interacciones entre n partículas [4], todas contra todas, cada interacción involucra típicamente alguna función de Green proporcional a una potencia inversa de la distancia, así como cada partícula tiene asociado un número constante de atributos geométricos y físicos. La forma de computar las interacciones da lugar a diferentes posibilidades, entre ellas los métodos directos y los jerárquicos.
Los métodos directos son los procedimientos clásicos de sumar por separado las influencias de cada partícula en un punto de observación dado, por lo cual se los denomina también interacciones partícula-partícula (PP). En el caso del BEM clásico, asumiendo que las partículas representan los elementos o paneles de la malla, las interacciones PP conducen al cálculo de matrices de influencia llenas (o densas) involucrando un costo computacional O(M2), donde M es el número de grados de libertad del problema BEM [5,6].
En cambio, en los métodos jerárquicos, o en árbol, las interacciones entre las partículas se organizan en una jerarquía de cúmulos de partículas, comenzando por un dominio (o celda espacial) que las contiene a todas hasta llegar a celdas con una única partícula. Esto es, emplean una estrategia de «dividir para vencer» con el fin de reducir el número de operaciones en base a la idea intuitiva de que la contribución de un cúmulo de partículas que está suficientemente lejos de un punto de observación x puede ser aproximada mediante valores representativos al centroide del cúmulo. Por ejemplo, en el caso del BEM de bajo orden que se expone en este trabajo, dichos valores representativos incluirán el promedio 〈ψ〉 de la densidad superficial de capa doble, el promedio 〈n〉 de las normales, así como también la suma acumulada de las áreas A(e) de todos los elementos e ubicados dentro de un cúmulo dado.
Entre las variantes más difundidas se cuentan los métodos jerárquicos de bajo orden tipo Barnes-Hut (BH) [7,8], y los métodos jerárquicos de alto orden o, simplemente, métodos multipolares rápidos (FMM, por Fast Multipole Method) [9,10]. Ambas variantes construyen una estructura de datos obtenida mediante una subdivisión recursiva del espacio en celdas usualmente cúbicas, generada en forma jerárquica o recursiva, cuya estructura final dependerá de la distribución espacial de las partículas y de los algoritmos de subdivisión empleados [11]. Mientras que en las variantes de bajo orden se logra la precisión deseada restringiendo los cúmulos que pueden interactuar con una dada partícula, en las variantes FMM, en cambio, se emplean expansiones multipolares a una dada precisión y, en general, aseguran un mejor control en el error de aproximación, al costo de una programación bastante más elaborada cuando los dominios son tridimensionales (3D) [12,13].
En las alternativas tipo FMM se calculan interacciones Celda-Celda (CC), mientras que en las variantes de BH son interacciones Partícula-Celda (PC) y, en algunos casos, interacciones PP. Esto último puede suceder cuando la partícula está tan próxima de una celda que, al subdividirse esta recursivamente, se llega a las celdas más pequeñas posibles, que son aquellas que contienen una única partícula. En general, las aproximaciones PC son gradualmente mejores a medida que la distancia de interacción es mayor, así como también cuando el diámetro de la celda espacial es menor.
La utilidad práctica de las formulaciones rápidas, esto es, con un costo computacional significativamente menor que O(M2), se evidencia cuando se las entrelaza con los métodos iterativos para resolver de manera aproximada el sistema de ecuaciones relacionado con la formulación integral asociada al BEM. Una comparación entre los métodos jerárquicos de bajo orden, tipo BH [7,8], y los de alto orden, tipo FMM, se realiza en [14] (Sec. 5.2.4).
En [15] se consideró una variante del FMM aplicada a interacciones de partículas esféricas inmersas en flujos estacionarios de fluidos gobernados por las ecuaciones de Laplace o de Stokes, cuyo desempeño se presentó en simulaciones computacionales empleando entre 512 y 8.192 partículas, mientras que en [16] se propuso un FMM para problemas gobernados por las ecuaciones de Helmholtz y de Maxwell en electromagnetismo. Asimismo, en [17] se propuso una variante basada en FMM para el cómputo del Stokeslet y del stresslet involucrados en los métodos que emplean singularidades de ese tipo para modelar flujo de Stokes en un dominio tridimensional, aunque los ejemplos numéricos se restringieron a tests de tiempos de CPU.
Otras veces, los FMM se entrelazan con otros recursos tales como las sumatorias rápidas en las variantes de Ewald o de Wolf, diseñadas en electrostática para sumandos con decaimientos proporcionales a 1/r, donde r es la distancia de separación entre las singularidades, y que son empleadas en dinámica molecular [18,19]. Por ejemplo, en [20] se la utiliza en integrales de borde aceleradas para modelar flujo multifase en geometrías no periódicas, mientras que en [18] es parte de una técnica espectral para la evaluación rápida de sumas de n singularidades de tipo Stokeslet en arreglos periódicos.
Un algoritmo jerárquico tipo BH involucra, primero, la construcción de una estructura de datos en la forma de un árbol de octantes (u octree) en el caso específico de un dominio 3D [12,13,7]. Luego, construye aproximaciones de la influencia en un punto de observación x y, toda vez que se pueda, las utiliza para reemplazar la influencia ocasionada por las partículas ubicadas dentro de una celda cúbica, las cuales definen un cúmulo, por su efecto concentrado en su centroide. De este modo, las n partículas quedan organizadas en una jerarquía de celdas (o cubos) anidadas, dando lugar a un árbol de octantes en 3D. A medida que el número de nivel aumenta, cada cubo de lado L asociado a la celda cúbica es dividido en 8 cubos de tamaño L/2, que representan las escalas espaciales de menor tamaño [11]. Si una celda no puede aproximar con suficiente exactitud la influencia en el punto de observación x, entonces su contribución es reemplazada por la suma de las contribuciones de sus celdas hijas. Esta construcción tiene un costo computacional O(Mlog(M)), que es significativamente menor con respecto al O(M2) del algoritmo estándar «todos contra todos».
Los algoritmos jerárquicos de bajo orden de tipo BH son actualmente motivo de atención. Por ejemplo, para simulaciones computacionales en diversas aplicaciones, entre ellas, electromagnetismo [21], apantallamiento electrostático [22], ecuación de Helmholtz [23], fractura en elasticidad tridimensional [24], dislocaciones dinámicas en deformaciones plásticas [25], interacción de vórtices en fluidos [26], así como también astrofísica [27]. En particular, en [28] se extiende el algoritmo de árbol jerárquico de BH para el cálculo del potencial multicuerpo de orden n debido a las interacciones entre n-uplas de partículas, de un modo similar al potencial de 3 cuerpos que se emplea para describir la interacción simultánea de 3 partículas, que no es capturado usando el potencial de interacción de a 2 partículas. Cabe notar también que el uso de los octrees en simulaciones computacionales con n partículas es de creciente interés cuando se los emplea en las GP-GPU (General-Purpose computing on Graphics Processing Units), como en [29], [30] y [31].
En este trabajo se propone un método de elementos de borde jerárquico (HBEM, por Hierarchical BEM) y de bajo orden, basado en una variante descendente del árbol de octantes autoadaptativo de BH [8]. En los ejemplos se considera flujo de Stokes en régimen estacionario alrededor de cuerpos rígidos tridimensionales, el cual será modelado mediante una ecuación integral de borde (BIE, Boundary Integral Equation) en la alternativa CIV (Completed Indirect Velocity), según la taxonomía que se da en Ingber-Mammoli [32]. Esta alternativa es de tipo indirecto y de segunda clase, cuyo término fuente es función de la velocidad no perturbada, mientras que el operador integral se modifica para completar su espectro de autovalores. De esa manera, los modos rígidos son eliminados y se pueden representar una fuerza y una cupla no nulas sobre el cuerpo [33,34]. El campo solución en la Completed Indirect Velocity-Boundary Integral Equation (CIV-BIE) es la densidad superficial de capa doble ψ, que no cuenta con un significado físico directo. El modelo BEM empleado es de bajo orden para elementos triangulares planos, cuyo sistema de ecuaciones lineales se resuelve numéricamente mediante el método del residuo mínimo generalizado (GMRES) [35] sin precondicionamiento.
2Formulación integral2.1Ecuación integral de borde en la alternativa CIV-BIEDado un cuerpo rígido, cerrado y de superficie suave a trozos A, puede calcularse el flujo reptante a su alrededor mediante la alternativa de Hebeker [36], que constituye una extensión de la propuesta de Power y Miranda [34], ambas analizadas en Pozrikidis [33]. Esta puede escribirse de la siguiente manera:
donde el campo solución es la densidad superficial de capa doble ψ(x), mientras que ui(x) son las componentes de la velocidad del flujo sin perturbar. Los elementos diferenciales de superficie se denotan por dAx=dA(x) y dAy=dA(y), y los puntos de integración y de observación son y=(y1, y2, y3) y x=(x1, x2, x3), respectivamente (ver fig. 1).El núcleo de capa doble K˜ij=K˜ij(x,y) es un tensor de rango 2 producido por una densidad de stresslets distribuidos sobre la superficie del cuerpo [37,38,33], y está dado por:
siendo nk=nk(y) la normal unitaria a la superficie en el punto de integración y, y μ la viscosidad dinámica del fluido. Para superficies suaves, este núcleo verifica la siguiente propiedad:donde δij es la delta de Kronecker. Por otra parte, el núcleo H˜ij=H˜ij(x,y) es la siguiente suma:en la cual K˜ij(x,y) está definido por la ecuación (2), mientras que S˜ij(x,y) es el núcleo sourcelet dado por:donde χH es un parámetro positivo arbitrario que acopla la densidad de capa simple ϕ con la densidad de capa doble ψ, es decir:En el trabajo de Hebeker se concluye que χH=1 es una buena elección, motivo por el cual en este trabajo se adoptará dicho valor. El núcleo S˜ij(x,y) es un campo auxiliar ad hoc que permite eliminar los modos rígidos y que da cuenta de la fuerza y el torque global sobre el cuerpo [38].2.2Aproximación de la CIV-BIE mediante una técnica de colocaciónUna solución aproximada de la ecuación (1) puede obtenerse mediante una técnica por colocación, en la cual la densidad superficial de capa doble se asume constante en cada elemento, resultando el sistema discreto:
para p=1, 2, …, E, donde H˜(p,q)=H˜(x(p),y(q)) y K˜(p,q)=K˜(x(p),y(q)) así como los vectores u(p)=u(x(p)) y ψ(p)=ψ(x(p)), son evaluados en los centroides de los elementos x(p) mediante el doble lazo p, q=1, 2, …, E, siendo E el número de elementos en la malla BEM. A nivel discreto, los valores por elemento y nodales son denotados con supra y subíndices, respectivamente. Usando notación matricial y reordenando:donde:son vectores globales, y […]T denota la traspuesta. Las matrices globales Q y S están dadas por las sumas:respectivamente, con p=1, 2, …, E, donde:cuyas matrices elementales están dadas por:3Árbol descendente de Barnes-Hut autoadaptativoUn algoritmo jerárquico construye primero una estructura de datos de tipo árbol con raíz [39] para la representación jerárquica del espacio tridimensional ℝ3 en octantes, y luego calcula las interacciones efectuando un recorrido por el árbol, posiblemente en forma parcial.
Cada vértice v en un árbol con raíz tiene asociado un número de nivel, que es igual a la longitud del único camino que lo une con el vértice raíz. En consecuencia, el vértice raíz tiene el número de nivel cero, mientras que a medida que los vértices quedan más alejados de la raíz, el número de nivel aumenta. La altura de un árbol es el máximo número de nivel. Por otra parte, 2 vértices cualesquiera en un árbol son adyacentes cuando están unidos por una arista. Los hijos de un vértice v en un árbol son los vértices adyacentes ubicados en el siguiente número de nivel, o «hacia abajo» cuando la raíz del árbol se dibuja arriba. Los vértices sin hijos son las hojas del árbol y tienen los números de nivel más elevados. Los antecesores de un vértice diferente de la raíz son todos los vértices que aparecen en el único camino desde la raíz hasta ese vértice, excluyendo a este último e incluyendo a la raíz.
Cada partícula interactúa con una parte del árbol, pues aquellas partes de la nube de puntos que queden más alejadas de la partícula considerada interactúan con ella a través de los niveles más bajos del árbol, i.e., más cerca del vértice raíz, mientras que las partes de la nube más cercanas a la partícula considerada influyen en los niveles más altos del árbol, es decir, más cerca de las hojas.
En la sección 3.1 se resume la construcción de un árbol de BH, donde las partículas contenidas en las hojas representan los paneles de la malla de elementos de borde. Por este motivo, se utilizará indistintamente la denominación de elemento, panel o partícula para los elementos de la malla BEM.
3.1Ingreso secuencial de los paneles de la mallaLa construcción del árbol, naturalmente recursiva, se puede hacer ya sea en forma ascendente, desde las hojas hasta la raíz [40], o bien en forma descendente, desde la raíz hacia las hojas, como en la versión original de Barnes-Hut [8], propuesta como una mejora al método de Appel [41].
El algoritmo recursivo de BH es inherentemente adaptativo, pues no hace ninguna suposición sobre la distribución espacial de las partículas en el octante raíz. En particular, en este trabajo se propone una implementación de dicho algoritmo en una variante mejorada propuesta por Amor López [14], en el cual las partículas son ingresadas de una en una. La construcción del árbol T se resume con el algoritmo 1, que es una adaptación del dado por Demmel [42].
Algoritmo 1 Construcción del árbol T de BH a partir del arreglo XE con los valores por centroide de la malla BEM.
donde XE∈ℝE×nc es un arreglo de dimensión E y nc registros, con los datos de los paneles (o elementos), y que incluyen, entre otros, las coordenadas, las áreas, las normales y las densidades por elemento. En los algoritmos se denotará, por ejemplo, con A(I).B el registro B de la componente I del arreglo A.
Cada partícula añadida recorre la línea de antecesores del vértice destino, esto es, visita aquellos vértices ubicados a lo largo del único camino que une la raíz del árbol actual con el vértice destino. El vértice destino es aquel ubicado en el nivel más bajo que podrá contenerla (fig. 2). Al hacerlo, se actualizan el área acumulada, la normal promedio y el centroide del cúmulo en cada vértice de la línea de antecesores por los cuales pasa. Esto puede hacerse o bien después de terminar de construir el árbol para entonces calcular los centroides y las áreas de todos los vértices, o bien durante el ingreso de cada partícula. La segunda alternativa, que tiene la ventaja de involucrar un menor número de operaciones, es la que se adopta en este trabajo, y se detalla en la sección 3.2.
Esquema simplificado de un árbol T de BH. Los paneles de la malla están en sus hojas y los simbolizan los triángulos. Los números de los vértices se indican sin corchetes y los de los paneles, entre corchetes, siendo 0 cuando el vértice posee más de un panel. En línea punteada se marca el único camino a la raíz para el vértice 6, cuyos antecesores son los vértices 5, 2 y 1.
Cada vértice tiene asociada una celda espacial en la forma de un cubo de tamaño variable, donde cada vez que el número de nivel se incrementa en una unidad, la longitud de la arista del cubo se reduce a la mitad. Al inicio solo está el vértice raíz, cuya celda asociada está vacía. La celda es un cubo en ℝ3 cuya longitud del lado y posición es tal que puede contener a toda la malla BEM. Luego se ingresan los paneles de la malla, de uno en uno, que en esta instancia se asimilan a partículas con propiedades geométricas y físicas (en el presente caso: centroide, área, normal y densidad superficial de capa doble ψ). Para cada panel e añadido, con e=1, 2, …, E, se realizan los pasos indicados en el algoritmo 2, adaptado de Demmel [42].
Algoritmo 2 Ingreso del panel genérico e dentro del árbol T de BH.
Input: arreglo XE, árbol T, un vértice k de T, y panel e.
Output: árbol T con el panel e ingresado.
1
procedureingresa_panel (XE, T, k, e)
2
z:= T (k).nro_de_partículas
3
switch(z)do
4
case(0)// vértice sin ocupar
5
almacenar el panel e en el vértice k.
6
case(1) // vértice ocupado por un único panel i
7
i:= T (k).panel
8
dividir el cubo del vértice k en 8 octantes
9
mover el panel i a su nuevo octante
10
actualizar el centroide asociado al vértice k
11
identificar el hijo h donde irá el panel e
12
ingresa_panel (XE, T, h, e)
13
case(2:)
14
identificar el hijo h donde poner e
15
ingresa_panel (XE, T, h, e)
16
endsw
La construcción recursiva de BH descendente dada por el algoritmo 2 da lugar a un árbol de octantes, una estructura de datos bien conocida para representar datos irregulares en ℝ3. En la versión descendente del algoritmo de BH, la construcción del árbol finaliza cuando se ingresan las n partículas, y cada hoja tiene 0 o 1 partícula.
Por otra parte, en el algoritmo de BH es necesario un test para decidir cuándo la celda del vértice k está lo suficientemente lejos de una partícula dada i. Existen diversas propuestas, todas basadas en consideraciones geométricas vinculadas con el diámetro de la celda y las distancias relativas. En el algoritmo de BH se considera que una celda c está alejada de la partícula i si la separación relativa verifica:
donde Dc es el diámetro de la celda, Lic=∥xi−yc∥2 es la distancia euclídea entre la posición xi de la partícula i y el centroide yc de la celda c, mientras que θ es un cierto valor umbral prefijado. Un valor umbral θ relativamente bajo implica que una partícula tiene que estar muy distante de la celda antes de aceptar una expansión multipolar, por lo que tanto el costo computacional como la exactitud aumentan cuando θ disminuye, pues el árbol tiene que ser atravesado hasta sus niveles más profundos, haciendo que se calcule un mayor número de interacciones directas entre partículas. En el límite θ→0 se recupera el caso todas contra todas, con un costo computacional O(M2), mientras que cuando 0≪θ≤1 hay menos interacciones directas.3.2Actualización diferencial en el árbol por el ingreso de un vérticeLa actualización diferencial en el árbol de los datos geométricos por el ingreso de un nuevo vértice es un recurso conveniente, siempre que la geometría del problema permanezca invariable. La actualización diferencial se realiza únicamente en los vértices ubicados en la línea de antecesores del vértice destino, por lo que el costo computacional es relativamente bajo. Se puede realizar de la siguiente forma: suponiendo que en una etapa dada en el árbol hay P partículas, entonces en cada vértice k se tienen las áreas:
y los centroidesrespectivamente, donde e es un elemento de la malla BEM, de área A(e), y Zk;P es el número de hijos del vértice k.Al añadir un nuevo elemento q de la malla de paneles, con centroide x(q) y área A(q), se tendrán P+1 partículas, y los nuevos valores para el área acumulada Ak;P+1 y del centroide xk;P+1 en cada vértice k por donde pasa la partícula añadida, es decir, la línea de antecesores del vértice destino, se actualizan con:
dados en [14] (sección 5.3.4, p. 186). Por ejemplo, en la figura 2 se muestra un esquema simplificado de un árbol de BH para el caso de 5 paneles, simbolizados por los triángulos y con centroides x(1) a x(5), donde los números sin corchetes indican el número de vértice, mientras que los números entre corchetes indican el identificador del panel, siendo 0 cuando hay más de uno. Solo se muestran el vértice raíz, los vértices internos activos (es decir, que contienen partículas) y las hojas. En dicha figura se ha marcado la línea de antecesores del vértice 6, es decir, los vértices 1, 2 y 5, los únicos que se modificaron cuando se ingresó el panel 3.3.3Actualización en el árbol promediando «hacia arriba»En cada etapa de una resolución iterativa por GMRES del sistema de ecuaciones discreto dado por la ecuación (7) hay que evaluar el producto matriz-vector w=Lv, donde el vector v representa vectores relacionados con la iteración m, mientras que L es la matriz del sistema. En el caso particular en que v=ψ(m), la evaluación rápida del producto matriz-vector dentro del algoritmo de BH implicará, además, calcular la densidad dipolar ψ en todos los vértices del árbol. Por ejemplo, en el caso de la figura 2, la densidad ψ en cada vértice del árbol T se puede calcular haciendo los promedios «hacia arriba», en el siguiente orden:
Esta tarea se puede hacer de forma sistemática recorriendo recursivamente el árbol de forma ascendente, desde sus hojas hacia la raíz mediante un recorrido en postorden [39], lo cual da lugar al algoritmo 3.Algoritmo 3 Promedio T.field∈ℝ3P×1 a partir del campo centroidal v∈ℝ3E×1.
El procedimiento promedio_up está dado por el algoritmo 4, donde λ=∅ representa el vértice vacío.
Algoritmo 4 Procedimiento auxiliar para el cálculo del promedio T.field∈ℝ3P×1 con un recorrido en postorden.
Input: árbol T, vértice k de T, y vector v.
Output: promedio en el vértice k de T.
1
procedurepromedio_up (T, k, v)
2
if (k = λ) then return
3
4
c:= hijo_mas_izquierdo (T, k)
5
if (c = λ) then //k es hoja
6
T (k).field:= v (k)
7
else
8
s:= 0
9
z:= 0
10
while (c ≠λ) do
11
promedio_up (T, c, v)
12
e:= T (c).panel
13
s:= s + T (e).field
14
z:= z + 1
15
c:= hermano_derecho (T, c)
16
T (k).field:= s / z
Cuando se emplea el método GMRES [35] para obtener una solución aproximada del sistema discreto dado por la ecuación (7), basta considerar el producto genérico matriz-vector w=Lv, donde v y w son los vectores de entrada y salida, respectivamente, relacionados con las diversas etapas en GMRES. En lugar de evaluarlo de forma explícita, es decir, cuando L=Q−S es la matriz explícita y densa del sistema de ecuaciones dada por la ecuación (7), se calcula con la siguiente forma implícita:
- 1.
Cálculo de vˆ en los P vértices del árbol T usando los «promedios hacia arriba»:
donde:es el vector con los valores de los campos iterados en los centroides de los E paneles, mientras que:es el vector con los valores de los campos iterados en los centroides de las P partículas. - 2.
Cálculo secuencial de w en los centroides de los E paneles:
donde α=raíz(T) es el valor inicial del índice α, mientras que el vector w(p,α) es el valor en los centroides de los paneles e involucra a su vez el cálculo recursivo:correspondiendo cada caso a: autoinfluencia, influencia cercana, influencia lejana e influencia intermedia, respectivamente. El número de partículas alojadas en el vértice α se indica con z=Z(α), mientras que:siendo I(α) el índice del panel alojado en el vértice α.
Algoritmo 5 Producto matriz-vector w = T(v).
En la ecuación (22), el índice β recorre todos los hijos del vértice genérico α y, además, se tiene en cuenta la condición sobre la separación relativa dada por la ecuación (13) a través de θ. Las matrices de influencia cercana en la ecuación (22) son las siguientes:
mientras que las matrices de influencia lejana son:Nótese que la matriz K(p,q) en la ecuación (24) incide tanto en el bloque diagonal A(p,p) como fuera de este, es decir, en B(p,q), y algo equivalente sucede con la matriz K(p,α) en la ecuación (25), lo cual es una consecuencia de la técnica de colocación dada por la ecuación (11). Además, los índices α, β recorren los vértices del árbol, mientras que los índices p, q recorren los paneles, en los siguientes rangos: 1≤α, β≤P, 1≤p≤E, y 0≤q≤E, donde 0<E<P.Algoritmo 6 Función auxiliar para el cálculo del producto matriz-vector w = T(v) usando el árbol T.
Input: arreglo XE, árbol T, vértice k de T y panel e.
Result: vector elemental w∈ℝ3×1.
1
functioninfluencia (XE, T, k, e)
2
z:= T (k).nro_de_partículas
3
switch(z)do
4
case(1) //se hace BEM clásico
5
j:= T (e).panel
6
if(j = e)then //panel e = panel j
7
w:= autoinfl_bem (XE, e)
8
else //panel e ≠ panel j
9
w:= infl_cercana (XE, e, j)
10
end
11
case(2:)
12
x:= XE (e).centroide
13
y:= T (k).centroide
14
D:= T (k).diámetro
15
L:= | x - y |2
16
if(D/L <θ)then
17
w = infl_lejana (XE, x, y)
18
else
19
w:= 0
20
foreach (hijo c de k) do
21
d:= influencia (XE,T,c,e)
22
w:= w + d
23
end
24
end
25
endsw
26
returnw
La ecuación (21) se calcula con el algoritmo 5, donde se empieza desde la raíz en cada iteración, mientras que la función auxiliar influencia está dada en el algoritmo 6. Las funciones autoinfl_bem, infl_cercana e infl_lejana en el algoritmo 6 calculan las ecuaciones (22a-c), respectivamente. Cabe notar que es también un algoritmo recursivo que recorre el árbol, posiblemente de forma parcial, pues no necesariamente tiene que llegar hasta todas las hojas; es decir, si un vértice α está lo suficientemente lejos como para calcular su aporte como vértice lejano, entonces no se recorre el subárbol de vértice α.
4Cómputo de las traccionesLa fuerza F=(F1, F2, F3) y el torque C=(C1, C2, C3) con respecto al origen O(x, y, z) del sistema de coordenadas cartesianas que actúan sobre el cuerpo son computados como un posprocesamiento mediante las integrales de superficie [34]:
El campo de tracción en la superficie del cuerpo es la superposición de las tracciones causadas por los potenciales de simple y doble capa. El valor directo de estas tracciones (sobre la superficie del cuerpo) se puede obtener mediante el cálculo de una integral de borde que es débilmente singular en el primer caso, e hipersingular en el segundo [43]. Dado que este trabajo está orientado principalmente a un esquema numérico para el primer caso, como una primera aproximación solo se calcula la contribución del potencial de una sola capa. Entonces, el campo de tracción ti(x)=σij(x)nj(x) en el punto de observación x, donde σij(x) es el tensor de tensiones, se obtiene usando [37, sección 3.2, p. 58],
donde K˜ji(y,x) es el núcleo traspuesto de la ecuación (2), y ϕj(y) es la densidad superficial de capa simple dada por la ecuación (6). Nótese que en la ecuación (27) se asume que el versor normal n(x) está bien definido en el punto de observación x. Esto impide su uso en lugares con discontinuidades geométricas, tales como nodos, aristas o vértices de la malla de superficie poliédrica, al menos en un sentido clásico. Este impedimento se salva, simplemente, haciendo el cómputo de las tracciones en los centroides de los paneles, que siempre son puntos regulares.La fuerza Fˆ y el torque Cˆ adimensionales sobre el cuerpo, y la tracción adimensional en la superficie τ se definen como:
donde U∞ es la rapidez de la corriente no perturbada, L es una longitud característica, F=∥F∥2, C=∥C∥2, y t(x)=∥t(x)∥2. Los subíndices i=1, 2, 3 indican la componente cartesiana xi correspondiente.5Ejemplos numéricosSe considera el flujo reptante y estacionario alrededor de una esfera y de otros cuerpos rígidos, donde los centroides de cada cuerpo coinciden con el origen de coordenadas cartesiano. En el caso de la esfera, los resultados son comparados con las soluciones analíticas para tres tipos de flujo entrante. En las simulaciones numéricas se adoptaron los siguientes valores: densidad del fluido ρ=1kg/m3, viscosidad cinemática ν=1m2/s, rapidez no perturbada U∞=10−3 m/s.
El número de grados de libertad en el esquema de colocación jerárquico es M=3E, mientras que el valor umbral adoptado es θ=0, 20, con lo que el porcentaje de coeficientes que se han calculado con expresiones de campo lejano ha fluctuado entre el 50 y el 70%. Las soluciones numéricas aproximadas se han obtenido utilizando residuo mínimo generalizado (GMRES) sin precondicionamiento [35].
En todos los casos, se aplica la regla de integración Q21, lo que significa que se usan 2 puntos de Gauss-Legendre en cada coordenada de integración en la autointegral y en las interacciones cercanas, y 1 punto en las interacciones lejanas [44]. La orientación de los ejes cartesianos en todas las figuras que muestran las distribuciones de las tracciones corresponde a la indicada en el esquema de la figura 1. En los ejemplos, el valor absoluto del error relativo |er| de la fuerza Fˆ adimensional es computado como |er|=|Fˆnum/Fˆ(semi)analítica−1|, y se muestra gráficamente en función del tipo de flujo incidente y del número de grados de libertad M.
5.1Esfera unitariaEn el caso de la esfera se conocen soluciones analíticas para diversos tipos de flujos incidentes. En particular, se consideran 3 de estos: uniforme, cortante y paraboloidal [34]. Las expresiones analíticas [45,46] para la velocidad no perturbada, la fuerza y el torque, en cada caso, se resumen en la tabla 1. En las simulaciones numéricas se considera una esfera de radio R=1 m. Se utilizaron 24 mallas con refinamiento creciente. Los números de nodos N (×103) y de elementos E (×103) en cada malla se resumen en la tabla 2. Para comprobar la estabilidad numérica de la solución, se hizo primero el cómputo con las mallas 21, 23 y 24, estructuradas y refinadas de manera uniforme, y luego se repitió el análisis con mallas perturbadas. Las mismas se obtuvieron de cada una de las anteriores introduciendo un desplazamiento nodal pseudoaleatorio tal que mantiene los nodos sobre la superficie de la esfera.
Flujo reptante estacionario alrededor de una esfera de radio R. Expresiones analíticas de la fuerza y torque para 3 tipos de flujo incidente [45,46].
Flujo incidente | Velocidad no perturbada u | Fuerza F | Torque C |
Uniforme | (U∞, 0, 0) | (6πμU∞R,0,0) | 0 |
Cortante | U∞(x2,−x1,0)/R | 0 | (0,0,8πμU∞R2) |
Paraboloidal | U∞(x12+x22,0,0)/R2 | (4πμU∞R,0,0) | 0 |
Flujo reptante estacionario alrededor de una esfera de radio unitario. Números de nodos N (×103) y de paneles E (×103) en cada malla.
z | N | E | z | N | E |
1 | 0,098 | 0,192 | 13 | 6,938 | 13,872 |
2 | 0,218 | 0,432 | 14 | 7,778 | 15,552 |
3 | 0,386 | 0,768 | 15 | 8,666 | 17,328 |
4 | 0,602 | 1,200 | 16 | 9,602 | 19,200 |
5 | 0,866 | 1,728 | 17 | 10,586 | 21,168 |
6 | 1,178 | 2,352 | 18 | 15,002 | 30,000 |
7 | 1,538 | 3,072 | 19 | 20,186 | 40,368 |
8 | 2,402 | 4,800 | 20 | 26,138 | 52,272 |
9 | 3,458 | 6,912 | 21 | 31,106 | 62,208 |
10 | 4,706 | 9,408 | 22 | 36,506 | 73,008 |
11 | 5,402 | 10,800 | 23 | 40,346 | 80,688 |
12 | 6,146 | 12,288 | 24 | 50,786 | 101,568 |
Como longitud típica en el cálculo de la fuerza, del torque y de la tracción adimensionales se emplea el diámetro de la esfera, es decir, L=2R=2 m. El valor exacto de la tracción sobre la superficie de una esfera bajo el efecto de un flujo uniforme es igual a la constante t=(3/2)μU∞/Re10, donde e10 es el versor cartesiano en la dirección x1. La tracción adimensional τ1=t1/(μU∞L−1) se muestra en la figura 3 para el caso de las mallas perturbadas 20, 22 y 24, sin que se evidencien cambios de importancia con respecto a las mallas con refinamiento uniforme.
Tracción adimensional τ1 sobre la superficie de la esfera unitaria usando HBEM, con las mallas 20, 22 y 24, de izquierda a derecha, perturbadas con un desplazamiento nodal pseudoaleatorio sin abandonar la superficie de la esfera. El valor analítico de esta tracción adimiensional es 3.
Se consideran diversas geometrías intrincadas o con aristas. El primer ejemplo es un cubo de lado L=1 m, los 2 siguientes están disponibles en la distribución del mallador NETGEN [47], mientras que los restantes se seleccionaron del repositorio «180 wrapped tubes»[48]. Algunos de estos últimos pueden considerarse aproximaciones a fibras retorcidas u organismos microscópicos. Las geometrías fueron generadas usando el mallador NETGEN [47]. En ninguno de los casos las surperficies se tocan entre sí, y encierran un volumen finito positivo. Las coordenadas nodales mínimas y máximas son −1/2 y +1/2, respectivamente, mientras que la velocidad no perturbada es U∞e10.
En la tabla 3 se listan los ejemplos considerados, incluyendo la cantidad de nodos N y de elementos E de las mallas respectivas siguiendo la nomenclatura dada tanto en Schöberl [47] como en Edelsbrunner [48], así como la cantidad de vértices V empleados en cada árbol de BH. La altura de cada árbol es de 7 excepto para z′=9, que es de 8.
z’ | Geometría | Caso | N | E | V |
1 | Cubo unitario | 8,67 | 17,33 | 26,51 | |
2 | Hollow cube | 6,01 | 12,04 | 17,94 | |
3 | Sculpted sphere | 6,38 | 12,76 | 18,49 | |
4 | Speed | (3,3/3) | 6,47 | 12,94 | 18,97 |
5 | Torsion | (1,6) | 5,05 | 10,10 | 14,88 |
6 | Curvature | (3, 6/3) | 6,59 | 13,18 | 19,34 |
7 | Hexagon knots | (1, 3, -24/6) | 5,88 | 11,76 | 17,14 |
8 | Square knots | (4, 3/4, 0) | 6,25 | 12,49 | 18,22 |
9 | Triangle knots | (1, 3, -15/3) | 5,79 | 11,59 | 16,90 |
10 | Circle knots | (3, 4/3) | 5,45 | 10,91 | 16,03 |
11 | Triangle tori | 7/4 time | 6,24 | 12,47 | 18,36 |
12 | Square tori | −8/4 time | 6,00 | 11,99 | 17,68 |
Los campos de la tracción adimensional τ1 obtenidos con HBEM se muestran en las figuras 4 y 5. La tracción adimensional τ1 exhibe el comportamiento esperado en la distribución y en el máximo valor en cada caso, con un incremento en la intensidad cerca de las aristas, y en magnitudes que no difieren significativamente de los correspondientes a la esfera. El caso del cubo ha sido validado anteriormente mediante un cálculo independiente, usando el software libre PETSc-FEM [49]. Este último es un código de cómputo distribuido basado en el método de elementos finitos y orientado a multifísica [50–52].
Geometrías intrincadas [48]. Arriba: hexagon knots (izq.), square knots (cen.) y triangle knots (der.). Abajo: circle knots (izq.), triangle tori (cen.) y square tori (der.). Tracción adimensional τ1 bajo flujo paralelo U∞=(10−3, 0, 0) m/s, usando HBEM.
En la figura 6 se muestra el valor absoluto del error relativo |er| (en porcentaje) para la fuerza adimensional Fˆ1 y el torque Cˆ3 sobre la esfera unitaria para mallas con refinamiento uniforme, y los flujos incidentes: er(Fˆ1) flujo uniforme (izquierda), er(Cˆ3) flujo cortante (centro) y er(Fˆ1) flujo paraboloidal (derecha), exhibiendo en todos los casos una convergencia monótona.
En la figura 7 se muestran curvas indicativas del costo computacional del HBEM comparadas con las correspondientes al BEM clásico, en el caso de la esfera unitaria con refinamiento uniforme y en función del número de grados de libertad M. En dicha figura se trazan las curvas para: el número zij de interacciones propias entre los paneles i−j (cuando i≠j), el número zii de autointeracciones y el número zpc de interacciones tipo PC, tanto para BEM (arriba a la izquierda) como para HBEM (arriba a la derecha). Por otra parte, la demanda de memoria primaria requerida con BEM se muestra en la citada figura, abajo a la izquierda, y la correspondiente a HBEM se muestra abajo a la derecha. Nótese que, como la matriz del sistema con BEM es densa y no simétrica, el BEM clásico rápidamente se vuelve impracticable, mientras que con HBEM se pueden considerar valores de M relativamente más elevados, dado que sólo se almacena el árbol de BH. Finalmente, el tiempo de CPU usando GMRES con HBEM se muestra abajo a la derecha en la misma figura, usando 4 núcleos de un procesador Xeon W3690.
Costo computacional en función del número de grados de libertad M, en la esfera unitaria con refinamientos uniformes. Números de interacciones propias zij (con i≠j), autointeracciones zii, y de partícula-celda zpc: con BEM (arriba a la izquierda) versus HBEM (arriba a la derecha). Memoria primaria con BEM versus HBEM (abajo a la izquierda), y tiempo de CPU con HBEM usando GMRES (abajo a la derecha).
En este trabajo se ha expuesto un método de elementos de borde jerárquico HBEM aplicado a la alternativa CIV-BIE, basado en una combinación del esquema de colocación estándar y del árbol jerárquico de bajo orden, autoadaptativo y descendente de Barnes-Hut. Las influencias entre los elementos que resultan de la propuesta son del tipo mixto, e incluyen interacciones tipo partícula-cúmulo, cuando la separación relativa es relativamente grande, así como interacciones partícula-partícula, cuando las partículas están relativamente próximas entre sí. La propuesta equivale a un método tipo matrix free y se ha empleado junto con resolución iterativa mediante residuo mínimo generalizado (GMRES) sin precondicionamiento. También ha sido pensada como complemento a los métodos directos en caso de mallas con elevado número M de grados de libertad. El costo computacional en memoria primaria ha sido significativamente menor al O(M2) asociado con el BEM clásico mediante colocación al centroide. El método se aplicó al caso de flujo de Stokes en régimen estacionario alrededor de cuerpos tridimensionales cerrados y rígidos, ya sea suaves, con aristas y vértices, o bien de forma intrincada. En las mallas se han empleado triángulos planos de bajo orden. La principal ventaja de la propuesta HBEM presentada se encuentra en que permite considerar un número de grados de libertad mayor comparado con los que pueden emplearse con los métodos más tradicionales de colocación al centroide. Esto se debe principalmente a la reducción en la demanda de memoria primaria para el cómputo y la consecuente disminución de los tiempos de cálculo.
Este trabajo ha sido financiado por el Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET, Argentina, proyecto PIP 112-20111-00978), la Universidad Nacional del Litoral (UNL, Argentina, proyecto CAI+D 2009–III-4–2), la Agencia Nacional de Promoción Científica y Tecnológica (ANPCyT, Argentina, proyectos PICT 2010-2492/16, PICT 2009-1141/07, PICT-PRH 2009-0147), EU-IRSES (PIRSES-GA-2009-246977), y ha sido parcialmente realizado con los recursos del Free Software Foundation/GNU-Project, tales como GNU–Linux-OS, GNU–GFortran, GNU–Octave, GNU–Git, GNU–Doxygen y GNU–GIMP, así como otros recursos de código abierto, tales como NETGEN, ParaView, OpenDX, Xfig y LaTeX. L. Dalcín ha hecho diversas sugerencias para mejorar la claridad en la presentación de los algoritmos.